¿Para qué queremos antropólogos si tenemos computadoras?

por SARAH SHULIST – Universidad de Queens

Durante el fin de semana, varios antropólogos llamaron la atención sobre un informe de investigación elaborado por la Universidad de Princeton. El título promociona la investigación con la afirmación: «El aprendizaje automático revela el papel de la cultura en la configuración del significado de las palabras». Mi respuesta, y la de muchos otros, fue inmediatamente sarcástica: no necesitábamos computadoras para decirnos algo que ya fue ampliamente demostrado por todo el campo de la antropología lingüística durante la mayor parte de un siglo, y por muchas personas que pusieron atención por más tiempo. Hubo un pequeño rechazo a estos comentarios, pero en última instancia todos comparten un cierto elemento temático: que incluso si ya lo sabíamos, nosotros, como antropólogos lingüísticos, deberíamos acoger este trabajo y la atención que se le presta como una nueva metodología que respalda lo que sabemos y hacemos.

El problema con esta afirmación es que no hace eso en absoluto. Y aquí tengo que reconocer el hecho de que mi propia respuesta frívola inicial sugiere absolutamente que sí, como señalé, “las máquinas se han puesto al día con mi conferencia de apertura en la introducción a la antropología lingüística”. Por supuesto, es cierto que la cultura da forma al significado dentro de los idiomas, y eso lo enseñamos como un principio central de la disciplina. El problema es que lo que los autores de este estudio quieren decir con eso y lo que nosotros queremos decir con eso son cosas fundamentalmente diferentes, como se hace evidente cuando lee más allá del titular. En cierto momento, esperaba que la lectura del artículo mitigara algunas de las preocupaciones que tenía, pero lamentablemente, aunque obviamente está escrito de una manera algo menos hiperbólica, la base conceptual, la aplicación metodológica y la interpretación involucradas en este artículo son, en mi opinión, una contribución frustrantemente defectuosa al estudio de la intersección del lenguaje y la cultura, por las razones que se describen a continuación.

La cuestión crucial para mí es cómo los autores definen «cultura» y establecen una versión cuantificada de «similitud cultural». Para que este análisis basado en máquinas funcione, la cultura debe reducirse a una lista de verificación de características. Para hacerlo, los autores se basaron en la antropología, específicamente, en el Atlas Etnográfico disponible en D-PLACE, que se basa en el trabajo de GP Murdock y sus estudiantes. Hay una interesante madriguera antropológica que analizar al examinar los desacuerdos entre Murdock y Edward Sapir, y considerar críticamente el enfoque enfáticamente «científico» y matemático de Murdock para estudiar las diferencias sociales humanas. Sin embargo, lo que les preguntaría a los autores en este caso es si han elegido este enfoque para estudiar la cultura después de una cuidadosa consideración del pensamiento histórico y contemporáneo sobre el concepto, o principalmente porque es el que les permite encajar en la cuestión de cultura en el molde computacional que desean explorar. Incluso la suposición de que los «idiomas» se corresponden claramente con las «culturas», en lugar de contener múltiples formas de hablar, o «idiomas» hablados por diversos grupos de personas, o tener una cultura definida por prácticas multilingües y multívocas, no se sostiene dentro de la antropología lingüística contemporánea.

Más en AntropoUrbana: No seamos santurrones respecto a las lenguas en extinción

Además, y de manera relacionada, mientras que el informe de Princeton sobre el estudio se promociona como abarcando un número notable de idiomas, 41 es de hecho una gota absolutamente diminuta en el cubo de la diversidad lingüística global, un punto que se vuelve aún más evidente cuando se mira el lista real de idiomas, que incluyen 25 de la familia indoeuropea, 4 idiomas turcos, 3 urálicos y 1 de cada uno del afroasiático (árabe), sino-tibetano (chino), dravidiano (tamil), kartveliano (georgiano), familias japónicas (japonesas) y coreanas (coreanas), así como vascas. Si bien me sorprendieron gratamente algunas de estas inclusiones (el georgiano y el vasco no entrarían en la lista de «sospechosos habituales»), la mayor parte de la lista es extremadamente estrecha como era de esperar. Además, uno podría preguntarse si estas etiquetas se mantienen tan bien. ¿Qué ingleses están representados aquí o qué versiones del español, chino o cualquier otro «idioma»?

Esta estrechez se agrava aún más a medida que el análisis selecciona cada vez más para centrarse en las lenguas indoeuropeas, porque son aquellas sobre las que está más disponible el tipo de información de cambio de lengua diacrónica que se utiliza para clasificar los grados de similitud lingüística/histórica. Los autores no justifican esta elección más allá del nivel de conveniencia, o realmente, en absoluto. Para encontrar la lista de idiomas hay que seguir los enlaces para llegar a las 300 páginas de material complementario que proporcionan. Esto me indica que no creen que la elección de los idiomas utilizados para sacar conclusiones sobre los significados «universales» y los patrones de las relaciones entre el idioma y la cultura requiera explicación. Una consideración más amplia del lenguaje a nivel global requeriría sintonizar con la complejidad del concepto de ‘palabras’, con las formas en que el significado se establece en la práctica, o con las implicaciones de cosas como la polisíntesis en cómo surgen estas formas de “universalidad”.

Más en AntropoUrbana: El lenguaje de la IA tiene poco del lenguaje oral humano

Para ilustrar lo que quiero decir, considere cómo el estudio habla sobre términos de parentesco y alineación. Para los autores, el análisis de la máquina demuestra que esta categoría de términos (al menos los más ‘comunes’ – los ejemplos que dan son ‘hija’, ‘hijo’ y ‘tía’) tienden a traducirse a otros idiomas con un alto grado de significado compartido. Pero los análisis etnográficos de las prácticas de parentesco sugerirían que incluso si los términos se «traducen», se utilizan de formas extremadamente diversas. En otras palabras, incluso haciendo la pregunta de «¿qué significa este término de parentesco?» requiere que comprendamos cómo una cultura determinada se acerca a ese «significado».

Este trabajo no se alinea con lo que los antropólogos lingüísticos hablan cuando estudian cómo el significado es diferente en los contextos culturales. Hay suposiciones importantes en el trabajo computacional que contradicen la comprensión del lenguaje y la cultura en la que la mayoría de nosotros trabajamos y, en particular, ignoramos las formas en que examinamos el lenguaje como una práctica social dinámica. El material del Atlas etnológico no es, por supuesto, el único criterio que utiliza el estudio para identificar la proximidad cultural, pero profundizar en otros aspectos del análisis revela supuestos similares. Como me señaló mi amiga Lavanya Murali, el tratamiento de la proximidad geográfica y la historia lingüística compartida, por ejemplo, en realidad no compite con la dinámica de cómo las personas interactúan a través de las fronteras lingüísticas, de modo que las similitudes se pueden producir a través de la interacción, en lugar de como un propiedad inherente del lenguaje, con ambos elementos, a su vez, abstraídos de una idea de «cultura». Todo esto, para mí, cuestiona el marco conceptual en el que se basa esta investigación y, al menos, demuestra que este trabajo no respalda las afirmaciones de los antropólogos lingüísticos sobre el lenguaje y la cultura.

Como tal, no se trata de decir lo mismo con evidencia metodológica diferente, sino de decir algo completamente diferente basado en un conjunto de supuestos completamente distintos sobre el idioma y la cultura; de hecho, trabajo muy duro para enseñarles a los estudiantes a examinar estos supuestos como afirmaciones ideológicas más que como verdades fundamentales. Esto incluso presenta algo así como un meta-comentario, ya que vale la pena señalar que el significado ni siquiera se alinea dentro de los idiomas, y que el significado de ‘significado’ no siempre es claro y traducible; podría continuar, pero ya entienden el punto.

Más en AntropoUrbana: Acerca del tiempo

Además de todo esto, quiero preguntar: ¿por qué esta investigación? ¿Por qué hacer estas preguntas? Esta ha sido una pieza central de la crítica que he traído a mis comentarios de Twitter menos sarcásticos, y que aún se mantiene después de leer el estudio en sí. El investigador entrevistado afirma que este es el primer enfoque «basado en datos» para la pregunta, y además explica que la motivación proviene del deseo de mejorar la necesidad que consume mucho tiempo de hacer cosas como «realizar entrevistas largas y cuidadosas con personas bilingües para evaluar la calidad de las traducciones”.

El primer comentario ilustra una creencia generalizada de que la etnografía no son datos y que valora lo cuantitativo y lo matemático como «prueba». Como muchas personas señalaron, una de las razones por las que esto nos pone nerviosos es que hemos estado «probando» las interrelaciones entre el lenguaje y la cultura de muchas maneras durante años, y este trabajo en realidad no se relaciona con nada de ese material, prefiriendo en su lugar retroceder varias décadas y utilizar un conjunto de datos que se ajuste a supuestos preexistentes.

El segundo punto tiene más matices, pero igualmente vale la pena abordarlo: ¿qué hay de malo en las entrevistas largas y cuidadosas? De hecho, una de las razones por las que la lista de idiomas utilizada aquí es tan limitada es porque esos son aquellos para los que se dispone de una cantidad suficiente de entrevistas largas y cuidadosas, material grabado y una miríada de otras formas de datos. No me queda claro, entonces, que este tipo de trabajo elimine de alguna manera la necesidad de desarrollar ese material en primer lugar, lo que plantea la cuestión de lo que logra. Como señalé en los tweets, las decisiones sobre qué preguntas hacer son las que merecen un escrutinio, porque los recursos se gastan investigando estas preguntas, lo que significa que esos recursos no están disponibles para otras preguntas. Y si se están consumiendo recursos haciendo una investigación que ignora y descarta el trabajo sobre temas aparentemente relacionados, tiene un impacto negativo en ese trabajo, por lo que, hablando por mí misma, como antropóloga lingüística, es decepcionante y frustrante ver no solo los elementos promocionales de este trabajo, sino ver cómo el proyecto en sí representa las preguntas que incluso necesitamos entender sobre el idioma y la cultura.

Fuente: Anthro{dendum}/ Traducción: Dana Pascal

¿Para qué queremos antropólogos si tenemos computadoras?

Comparte este texto

Textos recientes

Lucy, tres millones de años después

Enseñando sociología a futuros ingenieros

Plantaciones

Elogio del examen final oral en tiempos de ChatGPT

¿A los equipos con jugadores inmigrantes les va mejor en el Mundial de Fútbol?

¿Qué es la poesía antropológica?

El problema con los jóvenes de hoy («hoy» es la década de 1920)

Darwin hoy

Los animales urbanos se comportan igual en todo el mundo

Las publicaciones académicas necesitan mejorar su verificación de datos

Los pueblos indígenas aislados de Brasil

Enseñar a escribir mientras enseñamos antropología

¿Los adultos que van a Disney son aberraciones culturales?

La humildad del astrófago

Washington y la viruela

Hablemos del contexto

¿Ahora todos somos granjeros?

Reescribiendo la inteligencia técnica en el Pleistoceno medio

Urbanismo desordenado

Las ratas son grandes archivistas

Categorías