Meta anunció que abrirá el acceso a un modelo "grande" de lenguaje para investigación desarrollo de Inteligencia Artificial
Meta Platforms, propietaria de Facebook, está abriendo el acceso a un gran modelo de lenguaje para la investigación de inteligencia artificial, anunció la compañía de redes sociales este martes a través de un comunicado.
Meta dijo que el código es el primer modelo de lenguaje de 175 mil millones de parámetros que se puso a disposición de la comunidad de investigación de IA en general.
Los "modelos de lenguaje grandes" son sistemas de procesamiento de lenguaje natural que se entrenan en volúmenes masivos de texto y son capaces de responder preguntas de comprensión de lectura o generar texto nuevo.
En una publicación de blog, Meta dijo que el lanzamiento de su modelo "Transformador preentrenado abierto (OPT-175B)" mejoraría la capacidad de los investigadores para comprender cómo funcionan los modelos de lenguaje grandes.
Meta dijo que las restricciones en el acceso a dichos modelos habían estado "obstaculizando el progreso de los esfuerzos para mejorar su solidez y mitigar problemas conocidos como el sesgo y la toxicidad".
La tecnología de inteligencia artificial, que es un área clave de investigación y desarrollo para varias de las principales plataformas en línea, puede perpetuar los prejuicios sociales de los humanos en torno a cuestiones como la raza y el género. Algunos investigadores están preocupados por los daños que pueden propagarse a través de grandes modelos de lenguaje.
Meta dijo que "esperaba aumentar la diversidad de voces que definen las consideraciones éticas de tales tecnologías".
El gigante tecnológico dijo que para evitar el uso indebido y "mantener la integridad", estaba lanzando el modelo bajo una licencia no comercial para centrarse en casos de uso de investigación.
Meta dijo que se otorgaría acceso al modelo a investigadores académicos y personas afiliadas al gobierno, la sociedad civil y organizaciones académicas, así como a laboratorios de investigación de la industria. El lanzamiento incluirá los modelos preentrenados y el código para entrenarlos y usarlos.
Idealmente, del resultado de las investigaciones de académicos y desarrolladores de todo el mundo se espera generar modelos de lenguaje para las inteligencias artificiales con una mejor comprensión de la diversidad cultural y genética de la humanidad y reduzca las exclusiones que hasta el momento permean cuando una inteligencia artificial intenta "comprender" el comportamiento humano.
Entérate de la información más relevante en nuestra sección de noticias.