Cette percée remet directement en question la philosophie de l'industrie de l'IA selon laquelle « plus c'est gros, mieux c'est », dans laquelle les entreprises se sont lancées dans une course à la construction de modèles de plus en plus massifs. Alors que des concurrents comme GPT-4o d'OpenAI et Gemini Ultra de Google fonctionnent avec des centaines de milliards, voire des milliers de milliards de paramètres, l'architecture rationalisée de Phi-4 offre des performances supérieures en matière de raisonnement mathématique complexe.
Phi-4 est un petit modèle de langage (SLM) de pointe à 14 milliards de paramètres qui excelle dans le raisonnement complexe dans des domaines tels que les mathématiques, en plus du traitement conventionnel du langage. Phi-4 est le dernier membre de la famille Phi de petits modèles de langage de Microsoft et démontre ce qui est possible alors que l'entreprise continue de sonder les limites des SLM. Phi-4 est actuellement disponible sur Azure AI Foundry dans le cadre d'un accord de licence Microsoft Research (MSRLA) et sera disponible sur Hugging Face à partir de mi-décembre 2024.
Benchmarks Phi-4
Phi-4 surpasse les modèles comparables et plus grands sur le raisonnement mathématique grâce aux progrès réalisés tout au long des processus, notamment l'utilisation d'ensembles de données synthétiques de haute qualité, la curation de données organiques de haute qualité et les innovations post-entraînement. Phi-4 continue de repousser les limites de la taille par rapport à la qualité.
Phi-4 est particulièrement doué pour les problèmes mathématiques. Voici, par exemple, les résultats obtenus par Phi-4 sur des benchmarks de problèmes de concours de mathématiques :
Favoriser l'innovation en matière d'IA de manière sûre et responsable
Construire des solutions d'IA de manière responsable est au cœur du développement de l'IA chez Microsoft. Microsoft a par exemple mis ses solides capacités d'IA responsable à la disposition des clients qui construisent avec des modèles Phi, y compris Phi-3.5-mini optimisé pour les PC Windows Copilot+.
La plateforme Azure AI Foundry, quant à elle, fournit aux utilisateurs un ensemble robuste de capacités pour aider les organisations à mesurer, atténuer et gérer les risques liés à l'IA tout au long du cycle de vie du développement de l'IA pour les applications traditionnelles d'apprentissage automatique et d'IA générative. Les évaluations Azure AI dans AI Foundry permettent aux développeurs d'évaluer de manière itérative la qualité et la sécurité des modèles et des applications en utilisant des mesures intégrées et personnalisées pour informer des mesures d'atténuation.
En outre, les utilisateurs de Phi peuvent utiliser les fonctionnalités d'Azure AI Content Safety, telles que les prompts shields, la détection du matériel protégé et la détection du fondement. Ces fonctionnalités peuvent être exploitées en tant que filtres de contenu avec n'importe quel modèle linguistique inclus dans le catalogue de modèles de Microsoft et les développeurs peuvent intégrer facilement ces fonctionnalités dans leur application par le biais d'une API unique. Une fois en production, les développeurs peuvent surveiller la qualité et la sécurité de leur application, les attaques adverses et l'intégrité des données, et intervenir à temps grâce à des alertes en temps réel.
Phi-4 en action
Voici un exemple du raisonnement mathématique dont Phi-4 est capable.
Source : Microsoft
Et vous ?
Que pensez-vous de ce petit modèle de langage de Microsoft et de ses fonctionnalités ?
Trouvez-vous que les performances du modèle Phi-4 sont crédibles ou pertinentes ?
Voir aussi :
Rapport technique Microsoft Phi-3 : un modèle de langage très performant en local sur votre téléphone, qui rivalise avec Llama 3, Mixtral et GPT-3.5, et assez petit pour être déployé sur un téléphone
Microsoft lance Phi-2, un petit LLM plus performant que Llama 2 et Mistral 7B, il dépasserait le récent Gemini Nano 2 de Google
Microsoft prépare un nouveau modèle d'IA pour concurrencer Google et OpenAI. MAI-1 est décrit comme étant « bien plus grand » que les précédents modèles open source de Microsoft