miércoles, 30 de diciembre de 2009




Tema: Inteligencia Artificial


Pregunta de investigación: ¿Cuáles fueron los elementos que permitieron que el proyecto Golem pudiera llevarse a cabo?

Delimitación del tema: Estudios sobre inteligencia artificial en la UNAM actualmente.

Campo teórico.

Nuestra investigación se enfoca en los estudios que se han realizado sobre inteligencia artificial en la UNAM en este caso el proyecto Golem; por lo tanto nuestro campo teórico es la inteligencia artificial, la informática y los departamentos de la UNAM donde se llevan a cabo estos estudios.

Inteligencia Artificial
La inteligencia artificial es una rama de la informática que se dedica al desarrollo de agentes racionales no vivos es decir se encarga de crear maquinas con capacidad de realizar funciones que realizadas por personas requieren de inteligencia.

Informática
Por otro lado la informática es la ciencia aplicada que abarca el estudio y aplicación del tratamiento automático de la información, utilizando dispositivos electrónicos y sistemas computacionales. También está definida como el procesamiento automático de la información.

Departamento de Ciencias de la Computación-IIMAS-UNAM
El departamento tiene como finalidad realizar investigación básica y aplicada en ciencias de la computación, apoyar y fortalecer el Posgrado en Ciencia e Ingeniería de la Computación, así como a los diversos programas de licenciatura de la UNAM relacionados con esta disciplina científica, además de promover y difundir a las ciencias de la computación. Cuenta con investigadores y estudiantes que centran su trabajo en el desarrollo de proyectos de investigación tanto nacionales como internacionales y en el de tesis de doctorado, maestría y licenciatura. Se promueven el análisis y la crítica individual y de grupo a través de seminarios de investigación por área y departamentales, al igual que en la interacción cotidiana entre los investigadores y estudiantes. Se apoyan la organización y la participación, por parte del personal del departamento, en eventos científicos tanto nacionales como internacionales.
El departamento realiza investigación en las áreas siguientes:
• Inteligencia Artificial,
• Procesamiento de Imágenes y Reconocimiento de Patrones,
• Diseño Combinatorio
Y dentro del área de Inteligencia Artificial se lleva a cabo los siguientes proyectos:

1. El Proyecto DIME: Diálogos Inteligentes Multimodales en Español
2. Razonamiento Diagramático
3. Reconocimiento de Voz en Español
4. El Proyecto Golem
5. Construcción de Redes Genéticas con Verificación de Modelos
6. Navegación Robótica Usando Técnicas de Visión Computacional
7. Diseño y Control de Sistemas Auto-organizantes
8. Vida Artificial
9. Sistemas Complejos

Y es el proyecto Golem en el que se basa nuestra investigación. En el proyecto Golem se integran las tecnologías de reconocimiento de voz en español y de sistemas conversacionales en una plataforma de robótica móvil: el robot Golem. Este robot es capaz de fungir como guía de una sesión de carteles de los proyectos de investigación del Departamento de Ciencias de la Computación del IIMAS; para este efecto es capaz de sostener una conversación sencilla en la que se desplaza al cartel que se le indica y hace la explicación correspondiente en español hablado, con apoyos multimodales como textos, imágenes y videos. Actualmente se trabaja en extender sus habilidades lingüísticas así como en dotar al robot de capacidades de visión monocular y binocular (reconocimiento de objetos, de gestos y navegación con evasión de obstáculos) coordinadas con la conducta lingüística a lo largo de la conversación. El responsable de este proyecto es el Dr. Luis Pineda que es el Jefe del Departamento de Ciencias de la Computación IIMAS, UNAM.


Planteamiento del problema:

Pero cuáles fueron los elementos necesarios para llevar a cabo este proyecto, es precisamente en lo que se enfoca nuestra investigación y para ello acudimos a una entrevista al Departamento de Ciencias de la Computación del IIMAS en la UNAM.

Entrevista:

1. ¿Cuál fue el principal objetivo de llevar a cabo el proyecto Golem?

R: El objetivo del proyecto es la construcción de sistemas de conversación para el castellano hablado en contextos lingüísticos especializados.

2. ¿Cuáles son las funcionalidades del robot Golem?

R: Golem es un sistema que tiene muchos componentes, uno de ellos es propiamente el robot, pero la aportación central que ha hecho este laboratorio es crear un sistema que le permita al robot tener diálogos inteligentes en español. Los programas corren en tres computadoras que están conectadas con sus antenas vía inalámbrica. Los programas con los que trabaja están codificados en diferentes lenguajes, como Linux y Windows.

3. ¿Qué elementos son los que componen al robot Golem?

R: El componente central del proyecto es el llamado Sistema de Administración del Diálogo, una tecnología desarrollada por la UNAM que se encarga de llevar la conversación. Con ese sistema, el robot puede saber a qué se refiere una pregunta dentro del contexto de una conversación. Si la pregunta se sale del contexto que él domina, por ejemplo si se le pregunta algo de deportes cuando está hablando de ciencias de la computación, simplemente responde “no te entiendo”.

4. ¿A que dificultades se enfrentaron durante el desarrollo del proyecto?

R: El desarrollo de sistemas conversacionales requiere también contar con tecnología robusta pero flexible para el reconocimiento de voz. Los elementos básicos para la construcción de estos sistemas son los modelos acústicos, los diccionarios de pronunciación y los modelos del lenguaje. Al inicio del proyecto se pensó que sería posible adoptar un sistema de reconocimiento de alguna fuente académica o de investigación; sin embargo, esto no fue posible y fue necesario crear una infraestructura propia; desde el punto de vista algorítmico se adoptó el paradigma de los modelos ocultos de Markov para la creación de modelos acústicos, así como los paquetes o tool kits para creación de reconocedores de voz genéricos, primero el sistema HTK y luego el sistema Sphinx; sin embargo, para utilizar estas herramientas se requiere contar con una base de datos de información fonética con una base lingüística sólida así como de extensión suficiente, pero tampoco se encontró un recurso lingüístico de calidad disponible en nuestra lengua, por lo que fue también necesario crearlo; como producto de este esfuerzo a finales del 2003 y principios del 2004 se diseño y recolectó el Corpus DIMEx100; este recurso, además de proveer una fuente muy rica de información fonética del español de México, nos ha permitido crear una serie de reconocedores de voz con una calidad suficiente para ser utilizados en sistemas prototipos reales.

5. ¿Cuáles fueron los resultados del proyecto?

R: Los resultados del proyecto DIME se conjuntaron para la creación del robot conversacional Golem. El robot cuenta con un conjunto de censores y actuadores, así como de una interfaz de programación a nivel de sistema mediante la cual es posible leer el estado de cada censor en un momento dado y activar el mecanismo de control de movimiento del robot; cuenta también con un sistema de navegación básico por medio del cual es posible controlar su movimiento en un espacio cartesiano; en particular, se asume que el robot está en el origen de dicho sistema al activarse, y es posible especificar la posición y orientación a la que debe moverse, así como la velocidad con la que debe desplazarse.

Un segmento de conversación real con Golem se ilustra a continuación:

1 GOLEM: Inteligencia artificial tiene áreas, personal y proyectos.
¿Qué quieres que te explique?
2 USUARIO: Primero explícame los proyectos, por favor.
3 GOLEM: OK. Inteligencia artificial tiene los proyectos Dime, Dimex
100, Pitágoras, Golem y Reconocimiento Visual de Objetos. ¿Qué proyecto quieres que te explique?
4 USUARIO: El tuyo Golem.
5 GOLEM: Perdón, no te entendí.
6 USUARIO: Que me expliques el tuyo Golem!
7 GOLEM: OK. Yo soy Golem. Tengo poco más de 5 años y me programaron para darte esta visita guiada. Estoy programado bajo una estructura de agentes abiertos. Tengo un agente reconocedor de voz, un… ¿Quieres que te explique de mi manejador del diálogo?
8 USUARIO: Si, si quiero.
9 GOLEM: El manejador de diálogo es un intérprete de modelos de diálogo. Un modelo de diálogo es una representación de una conversación esquemática y un dominio conversacional. Se representa por un conjunto de modelos de diálogo…
10 GOLEM: Terminamos con el proyecto Golem. ¿Quieres que te siga explicando los proyectos de inteligencia artificial?
12 USUARIO: Claro que si.
GOLEM: Inteligencia artificial tiene los proyectos Dime, Dimex 100,
Pitágoras y Reconocimiento Visual de Objetos. ¿Qué proyecto quieres ver?
13 USUARIO: Muéstrame reconocimiento visual de objetos, por favor.
14 GOLEM: Los seres humanos son capaces de reconocer objetos y además pareciera que lo hacen con gran facilidad… Este proyecto tiene participantes, objetivo, descripción y resultados. ¿Qué sección quieres que te explique?
USUARIO: La de resultados.
GOLEM: Este video es un ejemplo de cómo una computadora ve el mundo y de cómo puede ir reconociendo los objetos que previamente ya conocía…
GOLEM: Terminamos con resultados. ¿Quieres que te siga explicando reconocimiento visual de objetos?
USUARIO: No, ya no.
15 GOLEM: OK. ¿Quieres que te siga explicando los proyectos de inteligencia artificial?
16 USUARIO: No, gracias. Ya me voy.
17 GOLEM: … Gracias por visitar el departamento de ciencias de la computación. Hasta luego.

6. ¿Actualmente el proyecto se esta implementando, en dónde?

R: El Robot Golem se presenta en el Museo de las Ciencias Universum de la UNAM para demostrar sus funcionalidades.


Justificación.

El propósito de esta investigación es difundir los estudios que se hacen sobre inteligencia artificial en México y de esta manera motivar a otros a que se sigan realizando y así sea una oportunidad para reorientar el esfuerzo que México está realizando en informática, pues si bien en la actualidad existen en el país 600 programas de licenciatura relacionados con la computación y más de 100 posgrados enfocados a las computadoras, la mayoría de los egresados trabaja en el área de servicios de cómputo, y sólo 550 están generando tecnología computacional.
Hay que reconocer que sí tenemos capacidad para hacer nuestras propias aportaciones al conocimiento mundial de la computación, pero para ello hay que hacer que la comunidad de científicos se agrupe, que el gobierno se dé cuenta que debe apostar por políticas de fomento más ambiciosas, y que las empresas vean las grandes ganancias que genera dar valor agregado a un producto cuando integra nuevo conocimiento. Un ejemplo de Intel, que cambia sus procesadores en forma frecuente, sin frenarse por la inversión en investigación”.
El especialista en ciencias de la computación y en modelos cognitivos dijo que algunas de las áreas donde hay fortaleza en la tecnología de la computación en México son las que se conjugan en el robot Golem, como el conocimiento de patrones, la geometría de patrones y la inteligencia artificial.


Conclusiones.


En este trabajo se describen los antecedentes, desarrollos y resultados principales de los proyectos DIME y Golem. El proyecto DIME es un proyecto a largo plazo que tiene por objetivo la creación de sistemas conversacionales en español hablado, con apoyos multimodales, para la solución cooperativa de tareas simples en dominios de interacción específicos entre seres humanos y sistemas computacionales; el proyecto Golem, por su parte, fue concebido para demostrar esta tecnología en un entorno útil y atractivo. De manera más teórica, estos proyectos tienen también la finalidad de explorar en que medida es posible comprender el lenguaje a través de la metáfora computacional.