Conntour raises $7M from General Catalyst, YC to build an AI search engine for security video systems
Conntour lève 7 millions de dollars de General Catalyst et YC pour construire un moteur de recherche IA pour les systèmes vidéo de sécurité
L'industrie de la technologie de surveillance est actuellement sous les projecteurs, mais pas pour les meilleures raisons. Avec la controverse autour de l'Immigration and Customs Enforcement des États-Unis utilisant le réseau de caméras de Flock pour surveiller des personnes, et le fabricant de caméras domestiques Ring critiqué pour ses nouvelles fonctionnalités permettant aux forces de l'ordre de demander aux propriétaires des enregistrements de leurs quartiers, un large débat se tient actuellement autour de la sécurité, de la vie privée et de qui surveille qui.
Cependant, la controverse n'efface pas les marchés, et l'amélioration continue des modèles de vision-langage a donné un nouvel élan aux entreprises développant de nouvelles façons d'aider les sociétés à surveiller ce qui se passe dans leurs locaux.
Selon Matan Goldner, co-fondateur et PDG de la startup de surveillance vidéo Conntour, l'éthique autour de ce sujet est suffisamment importante pour qu'il déclare que son entreprise est très sélective quant à ses clients. Cela peut ne pas sembler être un bon sens commercial pour une startup à peine âgée de deux ans, mais Goldner affirme qu'il peut se le permettre car Conntour a déjà plusieurs grands clients gouvernementaux et cotés en bourse, dont le Bureau central des narcotiques de Singapour.
« Le fait d'avoir de si grands clients nous permet de les sélectionner et de garder le contrôle […] Nous contrôlons vraiment qui utilise notre technologie, quel est le cas d'utilisation, et nous pouvons choisir ce que nous considérons comme moral et, bien sûr, légal. Nous utilisons tout notre jugement et prenons des décisions basées sur des clients spécifiques avec lesquels nous sommes d'accord [pour travailler] parce que nous savons comment ils vont l'utiliser », a déclaré Goldner à TechCrunch lors d'une interview exclusive.
Cette traction a aidé Conntour à être plus que sélectif. Les investisseurs ont pris note : la startup a récemment levé 7 millions de dollars lors d'un tour de financement initial auprès de General Catalyst, Y Combinator, SV Angel et Liquid 2 Ventures.
Goldner a déclaré que le tour s'est clôturé en 72 heures. « Je pense que j'ai planifié environ 90 réunions en huit jours, et juste après trois jours — nous avons commencé lundi et mercredi après-midi, c'était terminé », a-t-il ajouté.
Quoi qu'il en soit, Conntour a peut-être raison d'être exigeant, surtout compte tenu de la puissance des outils d'IA dans ce domaine. La plateforme vidéo de l'entreprise utilise des modèles d'IA pour permettre au personnel de sécurité d'interroger les flux de caméras en utilisant un langage naturel afin de trouver tout objet, personne ou situation dans les enregistrements, en temps réel — un moteur de recherche similaire à Google, mais spécifiquement conçu pour les flux vidéo de sécurité. Elle peut également surveiller et détecter des menaces de manière autonome en fonction de règles prédéfinies et générer des alertes automatiquement.
Contrairement aux systèmes hérités qui dépendent de définitions ou de paramètres prédéfinis pour détecter des objets, des motifs de mouvement ou des comportements spécifiques, Conntour affirme que son système utilise des modèles de langage naturel et de vision, ce qui lui confère un haut degré de flexibilité et d'utilisabilité. Un utilisateur peut demander : « Trouvez des instances de quelqu'un en baskets passant un sac dans le hall », et le système de Conntour recherchera rapidement tous les enregistrements ou flux vidéo en direct pour retourner des résultats pertinents.
Et parce que la plateforme intègre des modèles d'IA, les utilisateurs peuvent simplement poser des questions sur les enregistrements et obtenir des réponses sous forme de texte, accompagnées des flux vidéo pertinents, ainsi que générer des rapports d'incidents.
Le point fort de l'entreprise, cependant, est sa scalabilité. Goldner a expliqué que la plateforme se distingue principalement des autres services de recherche vidéo par IA parce qu'elle est conçue pour évoluer efficacement vers des systèmes comprenant des milliers de flux de caméras. En fait, il a déclaré que le système de Conntour peut surveiller jusqu'à 50 flux de caméras à partir d'un seul GPU grand public comme le Nvidia RTX 4090.
L'entreprise y parvient en utilisant plusieurs modèles et systèmes logiques, puis en identifiant quels modèles et systèmes l'algorithme doit utiliser pour chaque requête afin de nécessiter le moins de puissance de calcul possible tout en fournissant aux utilisateurs les meilleurs résultats.
Conntour affirme que son système peut être déployé entièrement sur site, complètement dans le cloud, ou un mélange des deux. Il peut s'intégrer à la plupart des systèmes de sécurité déjà en place, ou servir de plateforme de surveillance complète à part entière.
Cependant, un problème de longue date dans l'industrie de la surveillance vidéo persiste : la qualité de la surveillance est uniquement aussi bonne que les enregistrements capturés. Il est difficile de distinguer des détails à partir des enregistrements d'un parking mal éclairé enregistré par une caméra de basse résolution avec un objectif sale, par exemple.
Goldner affirme que Conntour se prémunit contre cette inévitabilité en fournissant un score de confiance avec ses résultats de recherche. Si la source d'un flux de caméra n'est pas de bonne qualité, le système retournera des résultats avec des niveaux de confiance faibles.
À l'avenir, Goldner déclare que le plus grand problème technique à résoudre est d'apporter le plein niveau de capacité des modèles de langage de grande taille (LLM) à son système tout en maintenant son efficacité.
« Nous avons deux choses que nous voulons faire en même temps, et elles se contredisent. D'une part, nous voulons fournir une flexibilité complète en langage naturel, de style LLM, pour vous permettre de poser n'importe quelle question. D'autre part, il y a l'efficacité, donc nous voulons que cela utilise très peu de ressources, car encore une fois, traiter [des milliers] de flux est juste insensé. Cette contradiction est la plus grande barrière technique et le plus grand problème dans notre domaine, et c'est ce sur quoi nous travaillons vraiment, vraiment dur pour le résoudre. »
Brief IA — Veille IA quotidienne
Toutes les innovations IA du monde entier, résumées et analysées automatiquement chaque jour.