Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Los investigadores José Hernández-Orallo y Cèsar Ferri, de la UPV, fueron seleccionados por OpenAI para evaluar la versión de pago de ChatGPT, GPT-4. Su objetivo era encontrar fallas en el sistema antes de su lanzamiento en marzo de 2023. Los investigadores tuvieron libertad para probar diferentes instrucciones y buscar respuestas con sesgos peligrosos. A través de este proceso, descubrieron que el sistema falla en áreas inesperadas y tiene capacidades de abstracción sorprendentes. Esta evaluación permitió a OpenAI mejorar el sistema antes de su lanzamiento al público.
El lanzamiento de ChatGPT, tanto con la versión GPT-3.5 como con GPT-4, generó preocupaciones entre los investigadores. Hernández-Orallo señala que el lanzamiento masivo de una herramienta de generación de texto avanzada puede llevar a atrofias cognitivas o al mal uso del sistema. Esta preocupación se suma al debate más amplio sobre el impacto social de la inteligencia artificial y la necesidad de evaluar cuidadosamente su desarrollo. Los investigadores consideran que es importante tomarse el tiempo necesario para evaluar el impacto de sistemas como GPT-4 antes de su lanzamiento al público.
Los investigadores descubrieron que GPT-4 tiene capacidades de abstracción sorprendentes. Por ejemplo, el sistema fue capaz de resolver una sopa de letras y adivinar figuras a partir de coordenadas espaciales. Esta capacidad de abstracción representa un avance significativo en la inteligencia artificial generativa. Sin embargo, también descubrieron que el sistema falla en áreas inesperadas, lo que resalta la importancia de evaluar y mejorar continuamente este tipo de sistemas antes de su lanzamiento al público.
El lanzamiento de ChatGPT y la evaluación de GPT-4 han generado preocupaciones sobre la responsabilidad y el impacto social de la inteligencia artificial. Los investigadores consideran que es necesario tomarse el tiempo necesario para evaluar y comprender el impacto de sistemas como GPT-4 antes de su lanzamiento al público. Existe un debate más amplio sobre la necesidad de frenar la carrera por la IA para ganar margen para evaluar su impacto social y evitar posibles consecuencias negativas.