GPT-4 et l'avenir de l'IA dans les entreprises : Les réflexions de Sameer Dholakia chez Bessemer Venture Partners
Les phases naissantes d'une nouvelle technologie ou d'une technologie émergente sont toujours des montagnes russes d'investissements et d'innovations. Cela donne souvent lieu à des combats passionnants et compétitifs entre les entreprises sur une courte période. Les nouveaux venus sur la scène lancent des coups d'éclat et les opérateurs historiques bien établis répliquent par des contre-attaques.
Il est difficile de prédire les gagnants avant que la poussière ne retombe, mais une chose est généralement certaine : si la technologie est suffisamment puissante, le monde des affaires l'envisage souvent en termes de vie avant et après son arrivée.
L'IA générative est une technologie récente qui a déjà un effet profond sur les entreprises. La viabilité de ses fonctionnalités et de ses cas d'utilisation crée une relation tantôt combative, tantôt coopérative entre les nouveaux venus et les entreprises en place qui s'efforcent d'accroître leur influence sur le marché. Cela a également conduit à une scène d'investissement en pleine effervescence, où le financement à ce stade de 2023 a déjà dépassé les 1,5 milliard de dollars levés sur l'ensemble de l'année 2020.
La récente sortie du très attendu modèle GPT-4 d'OpenAI a mis tout cela encore plus en perspective. Sa fonctionnalité multimodale est très impressionnante et ouvre la voie à des cas d'utilisation encore plus créatifs dont des entreprises comme Microsoft, Duolingo et d'autres tirent déjà parti.
Toutefois, la technologie ne s'arrêtera pas là. Le GPT-5 et d'autres modèles et cas d'utilisation verront le jour, ce qui entraînera une augmentation des fonds d'investissement et de la concurrence.
J'étais curieux de savoir comment l'arrivée du GPT-4 était perçue dans le contexte de la concurrence actuelle en matière d'investissement et de développement de produits. J'ai donc demandé à Sameer Dholakia, associé chez Bessemer Venture Partners et ancien PDG de SendGrid (qu'il a conduit à l'introduction en bourse), ce qu'il pensait de ce sujet.
Au cours de notre conversation, il a examiné le paysage actuel et prévu de l'investissement et du développement de l'IA générative sous l'angle de la publication de GPT-4 et de ses implications. Il a commenté tous les aspects de la question, de l'écart grandissant entre les fonctionnalités de modèles majeurs comme le GPT-3 et le GPT-4 aux questions que les sociétés de capital-risque doivent se poser lorsqu'elles examinent l'orientation de ce marché en pleine effervescence.
Lisez la suite pour connaître son point de vue d'expert.
Quel impact attendez-vous de GPT-4 en termes de fonctionnalité d'IA générative sous-jacente ?
Ce qui m'étonne le plus, c'est le bond en avant en termes de multimodalité. Elle est plus proche de l'homme dans sa capacité à voir une image de quelque chose avec du texte, à traiter les deux et à raisonner sur ce que cela signifie. C'est vraiment extraordinaire.
Je pense que le saut multimodal est en fait très important. Il établit une nouvelle base de référence pour ce qui reste à venir. C'est maintenant aux innovateurs, aux entrepreneurs et au reste du monde de trouver des cas d'utilisation et de se demander : "Maintenant, nous pouvons faire cette chose multimodale. Quels sont les problèmes qui peuvent maintenant être résolus et qui ne pouvaient pas l'être auparavant ?" Du point de vue du capital-risque, c'est le genre de choses que nous recherchons constamment : "Quelles sont les applications plus larges de cette innovation particulière ?"
Dans le monde de la santé, on pourrait donc imaginer, par exemple, l'utilisation de l'IA générative pour examiner une radiographie à l'aide des registres des visites précédentes. Vous pouvez déterminer ce qui a été établi lors de tests médicaux antérieurs à l'aide de textes et d'images. Ce n'est qu'un exemple parmi tant d'autres où les capacités multimodales de GPT-4 pourraient être vraiment intéressantes.
Qu'en est-il de l'impact sur les entreprises ?
Ce qui me passionne le plus dans le GPT-4, c'est ce qu'il laisse présager pour l'avenir des GPT-5, -6, -7, et ainsi de suite, si l'on considère l'écart entre les résultats des GPT-2, -3 et -4. Lorsque vous avez soumis quelque chose au GPT-2, j'ai eu l'impression que la réponse était peut-être l'équivalent d'un collégien. Le GPT-3 était celui d'un lycéen et le -4 est celui d'un universitaire (voire d'un docteur). Le système devient de plus en plus intelligent. Les améliorations sont de plus en plus marquées et les durées de cycle de plus en plus courtes.
C'est remarquable. Nous avons déjà vu cela se produire dans l'histoire de la technologie. Prenez la loi de Moore avec les microprocesseurs. Nous le constatons à nouveau et je suis sûr que quelqu'un développera une formule et inventera une expression qui sera l'équivalent de la loi de Moore pour les modèles d'IA générative - en notant probablement l'expansion extraordinaire des paramètres du modèle dans chaque génération successive.
GPT-2 comptait 1,5 milliard de paramètres. Le GPT-3 comptait 175 milliards de paramètres. La rumeur veut que GPT-4 ait 100 billions de paramètres, mais le PDG d'OpenAI a démenti cette information. Toutefois, compte tenu de l'augmentation massive des paramètres d'un modèle à l'autre, GPT-4 est susceptible d'en avoir beaucoup plus que son prédécesseur.
L'impact commercial de GPT-4 est donc la poursuite du raz-de-marée qui se profile déjà à l'horizon. Il sera tellement plus facile pour tous les éditeurs de logiciels de la planète d'intégrer ces capacités et pour la technologie de l'IA générative d'être utilisée par des milliards et des milliards d'êtres humains. Les 100 millions d'utilisateurs de ChatGPT ne sont que la partie émergée de l'iceberg.
Je ne peux pas prédire si GPT-4 ou -5 sera le point de basculement. Mais il ne fait aucun doute dans mon esprit que c'est vers cela que nous nous dirigeons. Et nous pouvons le voir venir avec les annonces de Microsoft et de Google concernant l'intégration de cette technologie dans leurs produits (par exemple MS Office et Google Apps). Je pense que l'impact de ces annonces sur les entreprises est considérable, car il sera beaucoup plus facile pour les entreprises et les fournisseurs comme eux de mettre la technologie entre les mains des milliards d'humains qui utilisent déjà des outils comme Word ou Docs, Powerpoint ou Slides.
On entend souvent dire que "la révolution de la GenAI n'en est qu'à ses débuts". Si je devais la comparer aux précédents changements de plateforme que j'ai vus, je dirais que nous sommes aux alentours de 1995 pour l'internet (le navigateur de Netscape a rendu le web plus accessible, et des entrepreneurs comme Jeff Bezos ont trouvé comment capitaliser sur les nouvelles capacités). Ou, si vous préférez une analogie plus moderne, nous sommes à l'été 2008, au moment de la révolution mobile (lorsque Apple a lancé l'App Store et permis aux développeurs de créer des applications natives d'ios). Nous ne pouvions pas imaginer à l'époque que des entrepreneurs comme Jack Dorsey, Evan Williams et Biz Stone l'utiliseraient pour catapulter Twitter ou que Travis Kalanick l'utiliserait pour créer de nouveaux services comme Uber ; ces développements auraient été impossibles sans l'App Store.
Ce qui me rend le plus enthousiaste à propos de la période que nous vivons actuellement, c'est que nous sommes sur le point de voir se libérer le génie créatif de la prochaine génération d'entrepreneurs qui s'emparent de cette nouvelle plateforme et apportent de nouvelles solutions sur le marché. Ils changeront ainsi notre façon de vivre et de travailler.
Où voyez-vous d'autres technologies d'IA générative ayant un impact majeur au fur et à mesure que la technologie progresse ?
J'ai beaucoup aimé la présentation de Meghan (Meghan Keaney Anderson, CMO de Jasper) lors de la conférence Gen AI. Je pense que c'était l'un des meilleurs exemples de la façon dont l'IA générative va être un multiplicateur de productivité, comme un copilote pour un spécialiste du marketing de contenu qui le rendrait cinq fois plus productif. À l'heure actuelle, le temps consacré à la rédaction et à la génération de contenu est tellement excessif. L'utilisation d'un outil d'IA générative permet aux gens de redistribuer leur temps à des étapes plus importantes du processus de rédaction (comme l'idéation, la recherche et l'édition), créant ainsi plus de satisfaction et d'engagement au travail.
À de nombreuses reprises, l'arrivée d'une technologie a amené les gens à se dire : "Cela va avoir un impact sur de nombreux emplois. Qu'est-ce que cela signifie ?" De mon vivant, certains emplois finissent par être impactés - mais ce que j'ai vu le plus souvent, c'est que les gens travaillent simplement sur des activités à plus forte valeur ajoutée, parce que la technologie et l'automatisation éliminent le banal, et permettent aux gens de travailler sur des choses plus intéressantes.
L'écart entre les principaux modèles étant de plus en plus court mais leurs capacités de plus en plus avancées, que pourrait signifier cette vitesse d'innovation pour les perspectives d'investissement futures ?
Je pense que cela renforce l'attention portée à la différenciation et au profil de risque. Nous sommes à un stade où, à mesure que les améliorations s'accélèrent, il est plus facile pour les opérateurs historiques d'intégrer eux-mêmes les capacités.
Le débat que nous avons souvent eu du point de vue du capital-risque est le suivant : "Il ne fait aucun doute qu'il s'agit d'une nouvelle technologie transformatrice, mais qui en sort gagnant ? Où se situe la valeur ajoutée ?" Nous essayons ensuite d'établir des analogies et de faire des prédictions. Est-ce que ce seront les opérateurs historiques, qui ont déjà des relations clients avec les entreprises, qui intégreront cette nouvelle capacité dans leurs propres logiciels ? Ou s'agira-t-il des nouveaux perturbateurs nets (appelés les natifs de l'IA) qui se présentent avec une nouvelle capacité tirant parti de l'IA générative ; des organisations qui évoluent rapidement et n'attendent pas le lendemain. Historiquement, on parie sur les innovateurs. Mais certains diront que, comme dans les guerres de l'informatique en nuage, c'est l'échelle qui compte. Il est donc possible que les entreprises en place gagnent (au moins au niveau de l'infrastructure). Personne n'a de boule de cristal et je soupçonne que la réponse sera différente selon la catégorie et la couche de la pile technologique.
Un autre élément à prendre en compte est que, compte tenu de la rapidité avec laquelle cette capacité arrive à maturité et de la facilité avec laquelle on peut y accéder par un appel d'API, la barrière à l'adoption est beaucoup plus basse qu'elle ne l'est historiquement lors d'un changement de plateforme.
Prenons l'exemple des entreprises qui sont passées d'un logiciel sur site à l'utilisation de la technologie en nuage. Si vous étiez un éditeur de logiciels sur site, vous deviez tout changer - de votre modèle commercial à votre tarification, en passant par votre processus de développement logiciel et votre infrastructure - pour devenir une entreprise SaaS orientée vers le nuage. La barrière à l'entrée de ce changement de plateforme était énorme. Vous avez donc parié sur les Salesforce du monde entier (qui ont fini par perturber Siebel), mais ce changement de plateforme est différent. Pour s'adapter, il suffit d'appeler une API ou d'intégrer un modèle LLM open source dans une pile technologique. Il n'y a pas le même obstacle perturbateur que ces autres changements de plate-forme ont eu historiquement. En tant que communauté du capital-risque, nous devons comprendre ce que tout cela signifie en termes de capture de valeur.
Ce que l'on observe aujourd'hui autour de l'IA générative, c'est un afflux massif de paris de la part de la communauté du capital-risque sur ce nouveau changement de plateforme. Certains le font au niveau de la fondation, d'autres au niveau de l'application et d'autres encore avec des entreprises qui font les deux (qui ont leur propre modèle et leur propre application). Ou du moins, nous ne saurons pas ce que c'est avant cinq à dix ans, mais nous verrons bien !