Harvard educará la inteligencia artificial con las mayores colecciones de datos del planeta

Harvard educará la inteligencia artificial con las mayores colecciones de datos del planeta

La universidad estadounidense lanzó la Institutional Data Initiative en colaboración con Google, Microsoft, OpenAI e instituciones del conocimiento como la Biblioteca de Boston.

SALA DE LECTURA. Una imagen de la Biblioteca de la Escuela de Derecho de Harvard, donde nació IDI. / HARVARD UNIVERSITY
26 Diciembre 2024

Harvard University se propone introducir los catálogos de las bibliotecas y los archivos de las instituciones del conocimiento en la inteligencia artificial (IA). Para ello, creó la Institutional Data Initiative (IDI) en el ámbito de la Biblioteca de la Facultad de Derecho. Este proyecto quiere torcer positivamente el rumbo de la IA al nutrirlo de la información pública que custodian toda clase de organizaciones con criterios de calidad, prestigio, ética, transparencia, apertura, diversidad y búsqueda del saber.

IDI fue lanzada el 12 de diciembre con el apoyo de los pesos pesados de la tecnología, como Microsoft, Google y OpenAI. La iniciativa arrancó con dos proyectos: por un lado, la próxima liberación de los datos contenidos en un millón de libros pertenecientes al dominio público que forman parte de la colección de Google Books. Y, por el otro, el escaneo de millones de páginas de diarios de dominio público resguardados en la Biblioteca Pública de Boston. 

"Los avances en la inteligencia artificial están generando un enorme interés por los datos de alta calidad, los cuales sólo se encuentran en las profundidades de los archivos. Este nuevo interés puede ayudar a las instituciones a poner esos datos al alcance de todos. IDI está dedicada a apoyar a nuestras instituciones hermanas mientras administran el conocimiento humano y buscan ofrecer el acceso más amplio a él en la era de la IA, tal como lo han hecho con otros medios a lo largo de los siglos y de las revoluciones tecnológicas que los han acompañado", explicó el director ejecutivo Greg Leppert en la nota de presentación de la IDI publicada el 12 de diciembre.

"Momento prometeico"

Harvard considera que los custodios tradicionales del conocimiento pueden "crear un momento prometeico" (en el sentido de dar un golpe audaz) si aprovechan la IA en un doble sentido: para moldearla y, a la vez, para divulgar información cuyo acceso ha sido históricamente restringido. Con esas misiones, IDI anunció su interés en colaborar con bibliotecas y universidades hasta grupos culturales y agencias gubernamentales para ayudar a estructurar, analizar y publicar sus colecciones como datos para todo tipo de usos, incluyendo IA. 

"Mediante el desarrollo de colecciones de datos ampliamente accesibles y bien comprendidas buscamos alinear los intereses de los creadores de modelos para que no se deje ningún dato atrás con los intereses de las instituciones del conocimiento, ofreciendo ventanas exhaustivas y representativas por las que cualquiera pueda asomarse", refirió Leppert acerca de los objetivos de IDI.

La visión de Harvard es que, con un enfoque como el que propicia, la comunidad de IA, incluyendo a quienes trabajan en modelos de código abierto, saldrá beneficiada. "El mayor acceso puede reducir la barrera de entrada para la creación de modelos, permitiendo que grupos más diversos participen en su construcción y ajuste. Puede aumentar la representación lingüística y cultural, permitiendo que los modelos sirvan a una mayor parte de la humanidad. Puede abrir la puerta a nuevas capacidades, incluidas el descubrimiento científico y médico. Y el acceso al conocimiento, junto con una administración continua, puede ser clave para sistemas de IA seguros y transparentes", apuntó el director ejecutivo.

En su presentación, IDI invitó a sumarse al "momento prometeico" a académicos, cientistas de datos, autoridades de instituciones del conocimiento y tecnólogos. Jonathan Zittrain, profesor de Derecho de Harvard y uno de los líderes de IDI, resumió la filosofía de la iniciativas en estos términos: "las bibliotecas y otros guardianes del conocimiento agregado de la humanidad a menudo piensan en términos de siglos preservando y proporcionando acceso a sus tesoros tanto para usos bien conocidos como para fines completamente no anticipados. El entrenamiento de IA entra en esta última categoría, incluidos los grandes modelos de lenguaje que se alimentan de casi incontables artefactos. Con IDI, nuestro objetivo es abordar el renovado interés de esos sectores en textos que, de otro modo, estarían oscurecidos o incluso olvidados, de maneras que mantengan al frente y en el centro los valores de las instituciones del conocimiento y de la sociedad".

WHATSAPP ESTUDIANTES ¡Tu voz es importante para nosotros! Contanos sobre eventos en Tucumán; proponé temas para nuestros artículos o comentá lo que estuviste leyendo. Escribinos al WhatsApp Estudiantes de LA GACETA.
Tamaño texto
Comentarios
Comentarios