DeepSeek explose en cercle la vague d’ia peut-elle reprendre?
Heure de mise à jour: févr. 10, 2025 Lectorat: 59
Ces derniers temps, DeepSeek a sans aucun doute été au centre des préoccupations de la science et de la technologie. Lancé par deepin, une start-up d’intelligence artificielle de phantom square, le grand modèle AI a atteint le sommet de la liste des téléchargements mondiaux sur plusieurs magasins d’applications. Depuis l’ouverture du marché après le nouvel an chinois, les indices tels que le concept DeepSeek et le cloud computing ont connu des gains de plus de 10%. Le secteur des ordinateurs et des médias est également en tête de la première catégorie de l’industrie citic.
La percée de DeepSeek se situe principalement au niveau du faible coût et de la capacité de raisonnement. Alors que le modèle V3 a fait des progrès significatifs en termes de coûts de formation et d’efficacité informatique, le modèle R1 a ouvert de nouvelles approches pour les modèles d’inférence de formation. Grâce à des optimisations d’ingénierie telles que FP8, MoE, MLA, PTX, il maximise non seulement l’utilisation des ressources de calcul et réduit considérablement les coûts (par exemple, son coût de formation n’est que 1/30 de son équivalent OpenAI), Il a également excellé dans les tâches de mathématiques, de code et de raisonnement en langage naturel, avec des performances supérieures à celles de OpenAI o1.
Avant le modèle deepseek-r1, les grands modèles de l’industrie utilisaient le RLHF (Reinforcement Learning from HumanFeedback, apprentissage par renforcement basé sur le feedback humain), qui utilisait un grand nombre de questions et réponses de haute qualité écrites par des humains pour comprendre «quelle est la bonne réponse», C’est comme si un Professeur Était toujours là pour guider la résolution du problème. Bien que cette approche soit efficace, elle présente des goulots d’étranglement. Le modèle R1 abandonne de façon radicale la partie HF (rétroaction humaine) du RLHF pour ne laisser que le RL pur (apprentissage par renforcement), ce qui équivaut à ne plus compter sur les instructions de l’enseignant, mais à faire ses propres efforts pour apprendre en essayant et en faisant des erreurs.
Concrètement, le modèle d’apprentissage par renforcement du modèle R1 se fixe deux «fonctions de récompense» :
Fonction de résultat correct: se donne une récompense chaque fois qu’une bonne réponse est trouvée. Cette réponse a été vérifiée par un outil externe pour s’assurer qu’elle est vraiment correcte.
Fonction de processus de pensée: même si la réponse n’est pas nécessairement tout à fait correcte, se donne une récompense tant que le processus de raisonnement est logique et clair et les étapes sont raisonnables. C’est comme résoudre un problème, même si la réponse finale n’est pas correcte, mais la pensée est excellente et mérite d’être encouragée.
De cette façon, le modèle R1 essaye constamment différentes méthodes de résolution de problèmes, puis évalue ses performances par rapport à ces deux règles de récompense. Il finit par apprendre quelles méthodes sont les plus efficaces et quelles étapes de raisonnement sont les plus raisonnables. Enfin, il devient de plus en plus intelligent et augmente ses capacités de raisonnement. Le plus important est que le modèle R1 ne nécessite pas de grandes quantités de données d’étiquetage dans le processus, mais renforce la capacité par l’autoapprentissage et l’optimisation. Dans le même temps, l’open source met en œuvre la discrimination positive du modèle, ce qui réduit l’écart technologique entre le modèle open source et le modèle source fermée, ainsi que l’écart technologique entre l’intelligence artificielle chinoise et américaine.
En ce qui concerne cette série de marchés de l’ia et les opportunités potentielles futures, le succès de DeepSeek signifie que le développement futur de l’ia dans le monde entier pourrait être plus pluraliste, tandis que la grande baisse du modèle devrait accélérer la formation d’une boucle fermée pour la commercialisation des applications d’ia. DeepSeek devrait accélérer le lancement des applications d’ia et stimuler la croissance explosive des besoins de post-entraînement et de calcul de l’inférence. La part de la demande d’extrémité de l’inférence sur la structure ultérieure de la plaque de calcul devrait encore augmenter, pour la puce de calcul d’inférence, la formation de la force de calcul d’extrémité est bonne.
D’un autre côté, les start-ups d’ia vont connaître une transformation de leur mode de fonctionnement: ceux qui comptent sur des grappes de GPU coûteuses peuvent être menacés de faillite en raison de leur désavantage sur le plan des coûts. Cela se traduira par une augmentation considérable de l’offre de gpus sur le marché d’occasion, tandis que les petites et moyennes entreprises d’ia seront plus susceptibles d’acheter des gpus bas de gamme plus abordables. Les exigences en matière de matériel connaîtront également une transformation structurelle: depuis l’année dernière, les exigences en matière de calcul fondées sur la formation ont commencé à se déplacer vers le côté de l’inférence. Cette tendance devrait se poursuivre à l’avenir et de nombreuses petites et moyennes entreprises d’ia ne se consacreront plus à la formation des modèles de base et adopteront plutôt des modèles open source comme DeepSeek. En outre, la position dominante de nvidia sur le marché de la formation sera probablement réévaluée.
-
Page précédente
Compte à rebours ! ExcessChip Technology Limited à l'Événement Électronique de Munich, ouvrant de nouvelles opportunités pour transformer des milliards de matériaux inactifs en valeur.
ExcessChip Technology propose des solutions complètes pour les stocks électroniques inutilisés, aidant les entreprises à récupérer des fonds et à optimiser leurs chaînes d'approvisionnement. Rejoignez-nous au Salon de l'Électronique de Munich Shanghai 2025, stand N2-608, pour découvrir no...
Heure de mise à jour: févr. 27, 2025
-
Page suivante
Huawei annonce une décision majeure ! Tous les nouveaux produits Huawei seront entièrement dotés du système d'exploitation natif HarmonyOS en 2025
Selon les nouvelles officielles de Huawei, en 2025, tous les nouveaux téléphones mobiles, tablettes et produits portables Huawei seront équipés par défaut du système d'exploitation natif Harmony lorsqu'ils quitteront l'usine, et de plus en plus d'anciens produits termineront progressivement...
Heure de mise à jour: janv. 04, 2025