Oportunidades para la IA en accesibilidad


En lectura Artículo reciente de Joe Dolson sobre la intersección de la IA y la accesibilidad, Aprecié absolutamente el escepticismo que tiene hacia la IA en general, así como hacia las formas en que muchos la han estado usando. De hecho, yo mismo soy muy escéptico con respecto a la IA, a pesar de mi papel en Microsoft como estratega de innovación en accesibilidad que ayuda a ejecutar el programa de subvenciones AI for Accessibility. Como ocurre con cualquier herramienta, la IA se puede utilizar de maneras muy constructivas, inclusivas y accesibles; y también puede usarse en otros destructivos, excluyentes y dañinos. Y también hay un montón de usos en algún punto intermedio mediocre.

El artículo continúa a continuación

Me gustaría que consideraras esto como un “sí… y” para complementar la publicación de Joe. No intento refutar nada de lo que dice, sino más bien brindar cierta visibilidad a los proyectos y oportunidades en los que la IA puede marcar diferencias significativas para las personas con discapacidades. Para ser claro, no estoy diciendo que no haya riesgos reales o problemas urgentes con la IA que deban abordarse; los hay, y tuvimos que abordarlos, como ayer, pero quiero tomar un poco de tiempo. Es hora de hablar sobre lo que es posible con la esperanza de que algún día lleguemos allí.

El artículo de Joe dedica mucho tiempo a hablar sobre modelos de visión por computadora que generan texto alternativo. Destaca un montón de cuestiones válidas con el estado actual de las cosas. Y aunque los modelos de visión por computadora continúan mejorando en la calidad y riqueza de detalles de sus descripciones, sus resultados no son excelentes. Como señala acertadamente, el estado actual del análisis de imágenes es bastante pobre, especialmente para ciertos tipos de imágenes, en gran parte porque los sistemas de IA actuales examinan las imágenes de forma aislada en lugar de dentro de los contextos en los que se encuentran (lo cual es una consecuencia de tener modelos “fundamentales” separados para análisis de texto y análisis de imágenes). Los modelos actuales tampoco están entrenados para distinguir entre imágenes que son contextualmente relevantes (que probablemente deberían tener descripciones) y aquellas que son puramente decorativas (que podrían no necesitar una descripción). Aún así, sigo pensando que hay potencial en este espacio.

Como menciona Joe, la creación humana de texto alternativo debería ser una realidad. Y si la IA puede aparecer para ofrecer un punto de partida para el texto alternativo, incluso si ese punto de partida podría ser un mensaje rápido ¿Qué es esta tontería? Eso no está nada bien... Permítanme intentar ofrecer un punto de partida.—Creo que es una victoria.

Llevando las cosas un paso más allá, si podemos entrenar específicamente un modelo para analizar el uso de imágenes en contexto, podría ayudarnos a identificar más rápidamente qué imágenes probablemente sean decorativas y cuáles probablemente requieran una descripción. Eso ayudará a reforzar qué contextos requieren descripciones de imágenes. y mejorará la eficiencia de los autores para hacer que sus páginas sean más accesibles.

Si bien las imágenes complejas, como gráficos y cuadros, son difíciles de describir de manera sucinta (incluso para humanos), el ejemplo de imagen compartido en el anuncio de GPT4 también apunta a una oportunidad interesante. Supongamos que te encuentras con un gráfico cuya descripción es simplemente el título del gráfico y el tipo de visualización que es, como por ejemplo: Gráfico circular que compara el uso de teléfonos inteligentes con el uso de teléfonos destacados entre los hogares estadounidenses que ganan menos de 30.000 dólares al año. (Ese sería un texto alternativo bastante terrible para un gráfico, ya que tendería a dejar muchas preguntas sobre los datos sin respuesta, pero, de nuevo, supongamos que esa era la descripción que estaba en su lugar). Si su navegador supiera que esa imagen era un gráfico circular (porque un modelo integrado concluyó esto), imagine un mundo donde los usuarios pudieran hacer preguntas como estas sobre el gráfico:

  • ¿Más personas utilizan teléfonos inteligentes o teléfonos básicos?
  • ¿Cuántos más?
  • ¿Existe un grupo de personas que no caen en ninguno de estos grupos?
  • ¿Cuanto es eso?

Dejando de lado las realidades de Alucinaciones del modelo de lenguaje grande (LLM)—donde un modelo simplemente inventa “hechos” que suenan plausibles—por un momento, la oportunidad de aprender más sobre imágenes y datos de esta manera podría ser revolucionaria para las personas ciegas y con baja visión, así como para las personas con diversas formas de color. ceguera, discapacidades cognitivas, etc. También podría ser útil en contextos educativos para ayudar a las personas que poder Consulte estos gráficos tal como están para comprender los datos que contienen.

Llevando las cosas un paso más allá: ¿Qué pasaría si pudieras pedirle a tu navegador que simplifique un gráfico complejo? ¿Qué pasaría si pudieras pedirle que aísle una sola línea en un gráfico lineal? ¿Qué pasaría si pudiera pedirle a su navegador que transponga los colores de las diferentes líneas para que funcionen mejor en su forma de daltonismo? ¿Qué pasaría si pudieras pedirle que intercambie colores por patrones? Dadas las interfaces basadas en chat de estas herramientas y nuestra capacidad existente para manipular imágenes en las herramientas de inteligencia artificial actuales, eso parece una posibilidad.

Ahora imagine un modelo diseñado específicamente que pueda extraer la información de ese gráfico y convertirla a otro formato. Por ejemplo, tal vez podría convertir ese gráfico circular (o mejor aún, una serie de gráficos circulares) en formatos más accesibles (y útiles), como hojas de cálculo. ¡Eso sería sorprendente!

Índice
  1. Algoritmos coincidentes#seccion 3
  2. Otras formas en que la IA puede ayudar a las personas con discapacidad#Sección 4
  3. La importancia de diversos equipos y datos#sección5

Algoritmos coincidentes#seccion 3

Safiya Umoja Noble dio en el clavo cuando tituló su libro Algoritmos de opresión. Si bien su libro se centró en las formas en que los motores de búsqueda refuerzan el racismo, creo que es igualmente cierto que todos los modelos informáticos tienen el potencial de amplificar el conflicto, los prejuicios y la intolerancia. Ya sea Twitter siempre mostrándote el último tweet de un multimillonario aburrido, YouTube enviándonos a un agujero Q o Instagram deformando nuestras ideas sobre cómo son los cuerpos naturales, sabemos que los algoritmos mal escritos y mantenidos son increíblemente dañinos. Mucho de esto se debe a la falta de diversidad entre las personas que los moldean y construyen. Sin embargo, cuando estas plataformas se construyen de forma inclusiva, existe un potencial real para el desarrollo de algoritmos que ayuden a las personas con discapacidades.

Llevar Mentra, Por ejemplo. Son una red de empleo para personas neurodivergentes. Utilizan un algoritmo para relacionar a los solicitantes de empleo con los empleadores potenciales basándose en más de 75 puntos de datos. En lo que respecta a la búsqueda de empleo, considera las fortalezas de cada candidato, sus adaptaciones necesarias y preferidas en el lugar de trabajo, las sensibilidades ambientales, etc. Por el lado del empleador, considera cada ambiente de trabajo, factores de comunicación relacionados con cada puesto de trabajo, etc. Como empresa dirigida por gente neurodivergente, Mentra tomó la decisión de cambiar el guión en lo que respecta a los sitios de empleo típicos. Utilizan su algoritmo para proponer candidatos disponibles a las empresas, quienes luego pueden conectarse con quienes buscan empleo en su interés; reducir el trabajo emocional y físico por parte del solicitante de empleo.

Cuando más personas con discapacidad participan en la creación de algoritmos, eso puede reducir las posibilidades de que estos algoritmos causen daño a sus comunidades. Por eso los equipos diversos son tan importantes.

Imagine que el motor de recomendaciones de una empresa de redes sociales estuviera ajustado para analizar a quién sigue y, si estuviera ajustado, para priorizar el seguimiento de recomendaciones para personas que hablaron sobre cosas similares pero que eran diferentes en algunos aspectos clave de su esfera de influencia existente. Por ejemplo, si siguieras a un grupo de académicos varones blancos no discapacitados que hablan sobre IA, podría sugerirte que sigas a académicos discapacitados o que no sean blancos o no sean hombres y que también hablen sobre IA. Si siguiera sus recomendaciones, tal vez obtendría una comprensión más holística y matizada de lo que está sucediendo en el campo de la IA. Estos mismos sistemas también deberían utilizar su comprensión de los prejuicios sobre comunidades particulares (incluida, por ejemplo, la comunidad de personas con discapacidad) para asegurarse de que no recomiendan a ninguno de sus usuarios que sigan cuentas que perpetúen prejuicios (o, peor aún, que escupen odio hacia ellos). ) esos grupos.

Otras formas en que la IA puede ayudar a las personas con discapacidad#Sección 4

Si no estuviera tratando de unir esto entre otras tareas, estoy seguro de que podría seguir y seguir, brindando todo tipo de ejemplos de cómo se podría usar la IA para ayudar a las personas con discapacidades, pero voy a hacer esta última sección en una especie de ronda relámpago. Sin ningún orden en particular:

  • Preservación de la voz. Es posible que hayas visto el papel VAL-E o Anuncio del Día Mundial de Concientización sobre la Accesibilidad de Apple o puede que esté familiarizado con las ofertas de preservación de voz de microsoft, Acapela, u otras personas. Es posible entrenar un modelo de IA para replicar su voz, lo que puede ser de gran ayuda para las personas que padecen ELA (enfermedad de Lou Gehrig) o enfermedad de la neurona motora u otras afecciones médicas que pueden provocar la incapacidad de hablar. Esta es, por supuesto, la misma tecnología que también se puede utilizar para crear deepfakes de audio, por lo que es algo que debemos abordar. responsablementepero la tecnología tiene un potencial verdaderamente transformador.
  • Reconocimiento de voz. Investigadores como los del Proyecto de accesibilidad del habla Pagan a personas con discapacidad por su ayuda en la recopilación de grabaciones de personas con habla atípica. Mientras escribo, están reclutando activamente personas con Parkinson y afecciones relacionadas, y tienen planes de expandir esto a otras afecciones a medida que avanza el proyecto. Esta investigación dará como resultado conjuntos de datos más inclusivos que permitirán que más personas con discapacidades utilicen asistentes de voz, software de dictado y servicios de respuesta de voz, así como controlar sus computadoras y otros dispositivos más fácilmente, usando solo su voz.
  • Transformación de texto. La generación actual de LLM es bastante capaz de ajustar el contenido del texto existente sin inyectar alucinaciones. Esto es enormemente enriquecedor para las personas con discapacidades cognitivas que pueden beneficiarse de resúmenes de texto o versiones simplificadas de texto o incluso texto preparado para Lectura biónica.

La importancia de diversos equipos y datos#sección5

Necesitamos reconocer que nuestras diferencias importan. Nuestras experiencias vividas están influenciadas por las intersecciones de las identidades en las que existimos. Estas experiencias vividas, con todas sus complejidades (y alegrías y dolores), son aportes valiosos para el software, los servicios y las sociedades que damos forma. Nuestras diferencias deben estar representadas en los datos que utilizamos para entrenar nuevos modelos, y las personas que aportan esa valiosa información deben ser compensadas por compartirla con nosotros. Los conjuntos de datos inclusivos producen modelos más sólidos que fomentan resultados más equitativos.

¿Quiere un modelo que no degrade, trate con condescendencia ni cosifique a las personas con discapacidad? Asegúrese de tener contenido sobre discapacidades escrito por personas con una variedad de discapacidades y asegúrese de que esté bien representado en los datos de capacitación.

¿Quieres un modelo que no utilice lenguaje capacitista? Es posible que puedas utilizar conjuntos de datos existentes construir un filtro que pueda interceptar y remediar el lenguaje capacitista antes de que llegue a los lectores. Dicho esto, cuando se trata de lectura de sensibilidad, los modelos de IA no reemplazarán a los editores humanos en el corto plazo.

¿Quiere un copiloto de codificación que le brinde recomendaciones accesibles desde el principio? Entrénelo con un código que sepa que es accesible.


No tengo ninguna duda de que la IA puede dañar y dañará a las personas... hoy, mañana y en el futuro. Pero también creo que podemos reconocer eso y, con miras a la accesibilidad (y, más ampliamente, la inclusión), hacer cambios reflexivos, considerados e intencionales en nuestros enfoques hacia la IA que también reducirán el daño con el tiempo. Hoy, mañana y en el futuro.


Muchas gracias a Kartik Sawhney por ayudarme con el desarrollo de este artículo, a Ashley Bischoff por su invaluable asistencia editorial y, por supuesto, a Joe Dolson por su ayuda.



Source link

Leave a Reply

Your email address will not be published. Required fields are marked *

Go up