Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124

Phi-2 es un modelo de lenguaje desarrollado por Microsoft que ha demostrado ser una revolución tecnológica en el campo de la IA. A diferencia de otros modelos más grandes, Phi-2 tiene solo 2,7 mil millones de parámetros, pero su rendimiento es similar o incluso superior. Esto demuestra que los modelos existentes pueden reducir su tamaño sin perder capacidades. Phi-2 está diseñado para ser utilizado en campos como la traducción, la generación de código y las matemáticas, y se espera que tenga un rendimiento destacado en tareas de cálculo de varios pasos.
Para entrenar a Phi-2, Microsoft utilizó datos de calidad de libros de texto cuidadosamente seleccionados. Estos datos incluyen conjuntos de razonamiento con sentido común y conocimientos generales. La empresa filtró los datos web utilizados en el entrenamiento según su valor educativo y calidad. A diferencia de otros enfoques de entrenamiento, Microsoft no utilizó el aprendizaje reforzado a partir de la retroalimentación humana, lo que resultó en un mejor comportamiento del modelo en términos de sesgos y respuestas tóxicas. El entrenamiento de Phi-2 fue un avance significativo en comparación con versiones anteriores, como Phi-1, y ha demostrado ser una herramienta prometedora en el campo de la IA.