Desde la finalización automática del código hasta la mejora de la calidad del software y la gestión de datos, los asistentes digitales inteligentes revolucionan el trabajo de los desarrolladores, los científicos de datos y los usuarios empresariales. Con el desarrollo masivo de la inteligencia artificial, está pasando por una de las transformaciones más importantes en la historia de la tecnología de la información, pero la transformación está acompañada de riesgos que pueden medirse frente a las enormes oportunidades que se están revelando.
¿La suma de inteligencia artificial y programación es igual a ganancia? – preguntó Bence Arato, Director General de BI Consulting, en su presentación de apertura en el cuarto día del Foro de Datos + ML de Budapest. En junio de este año, la consultora organizó un evento dos en uno por primera vez en la historia de las dos conferencias.La elección del tema de la presentación principal también hace referencia al entrelazamiento de los campos de la tecnología de datos, y es cada vez más cerca del rápido desarrollo de la inteligencia artificial.
Además de los anuncios cruzados de los principales proveedores de tecnología, el ritmo acelerado también se puede sentir en American Y Combinator W23, que es una de las compañías aceleradoras de startups más grandes del mundo, es decir, la descripción general de este invierno de startups que desarrollan tecnologías de IA generativa, donde solo En los campos de la ingeniería, incluido el desarrollo de software, se enumeran unas 30 empresas, y en los campos de los negocios hay incluso más.
En el análisis publicado por Omniscien Technologies en enero de este año, desde el modelado básico hasta el procesamiento del lenguaje natural y la extracción de documentos, también se incluyeron una treintena de tecnologías de IA en diferentes etapas de la curva de madurez. Algunos de ellos pueden alcanzar una aplicación práctica a gran escala en 2 a 5 años, la mayoría de ellos son de 5 a 10 años, la etapa de meseta de productividad, y entre ellos está la generación de código, que todavía se encuentra en la escalada inicial cuesta arriba de la innovación en la actualidad. . Pence Arato en su presentación.
Asistentes de código de rastreo
GitHub Copilot, inteligencia artificial que ayuda a los desarrolladores a trabajar con el autocompletado de código, debutó en junio de 2021. Copilot basado en la nube, que se ejecuta en un modelo de suscripción, se basa en el modelo de lenguaje GPT-3 de OpenAI, una versión patentada del mismo, Codex – Licenciante de Microsoft, la empresa matriz de GitHub.
Según una encuesta de GitHub del otoño pasado, los desarrolladores están muy satisfechos con la contribución de Copilot. La gran mayoría (88 por ciento) dijo que podía trabajar de manera más eficiente con soporte de codificación, casi todos (96 por ciento) confirmaron que podían terminar tareas repetitivas especialmente rápido y casi tres cuartas partes (77-73 por ciento) confirmaron que la cantidad de búsquedas El mínimo gracias al cual puedes sumergirte más profundamente en tu trabajo.
Comprensiblemente, el primer trago fue seguido rápidamente por nuevos ayudantes de código, como Amazon CodeWhisperer anunciado el verano pasado y generalmente disponible a partir de abril de este año, así como su hermano CodeGuru. Los desarrolladores también pueden usar este último en sus flujos de trabajo existentes para verificar automáticamente la calidad del código del programa, mejorarlo en función de las sugerencias entrantes y mejorar el rendimiento y el costo de la aplicación que se está creando. En mayo de este año, Huggingface anunció StarCoder y StarCoderBase codificando modelos de lenguaje grande (LLM), mientras que el asistente de IA de programación de CodeComplete, que actualmente se puede probar en versión beta privada, puede ser implementado por empresas en su propia nube o en el centro de datos local. . Para mayor seguridad, sus capacidades también son proporcionadas por sí mismo.Pueden establecer su propia base de código.
También están surgiendo asistentes digitales para automatizar las tareas de desarrollo individuales una a una. Por ejemplo, CodiumAI crea pruebas y Buildt ayuda a investigar y comprender rápidamente las bases de códigos grandes, lo que brinda un soporte particularmente útil para que los nuevos desarrolladores comiencen. Bloop cumple un propósito similar, que resume y explica el funcionamiento del código del programa en lenguaje humano en respuesta a preguntas en lenguaje natural, lo que ayuda a una mayor evaluación y planificación, así como a la comprensión. Grit Assistant automatiza la migración de código y la actualización de dependencias, mientras que el proyecto de investigación Google DIDACT utiliza un nuevo método para entrenar un modelo voluminoso de IA en el proceso de desarrollo de software en lugar de un código listo para el soporte inteligente del trabajo de ingeniería de software.
A pesar de todo el soporte de IA y automatización, los desarrolladores no pueden quedarse quietos, sobre todo porque, además de usar ayudantes, pueden familiarizarse con nuevos lenguajes de programación, interfaces, entornos y métodos.
Por ejemplo, Pandas AI es una biblioteca de Python que agrega capacidades de IA generativa a Pandas, una popular herramienta de análisis y procesamiento de datos, que se puede usar en conjunto. Con la ayuda de Jupyter AI, que está disponible como complemento de JupyterLab, los desarrolladores pueden explotar las capacidades de los modelos generativos de IA en portátiles de una manera eficiente y fácil de usar, aumentando así la productividad de JupyterLab y Jupyter Notebook.
Los cuadernos de ciencia de datos integrados y colaborativos, como Noteable, mejorado con ChatGPT, y Hex Magic, disponible en versión beta pública, respaldan el trabajo de los investigadores de datos con el procesamiento del lenguaje natural. Y Mito AI, ya utilizado por grandes instituciones financieras de todo el mundo, junto con su programa de chatbot y hoja de cálculo genera código Python para automatizar informes de Excel y análisis de datos.
Entre los nuevos lenguajes de programación, LMQL combina las ventajas de las instrucciones en lenguaje natural con el poder expresivo de Python para hacer que trabajar con LLM sea más eficiente, mientras que el lenguaje de programación Mojo combina la usabilidad de Python con el poder de C para todos los desarrolladores de IA.
Resulta que ChatGPT en sí mismo puede ser dirigido para imaginarse a sí mismo como un servidor de base de datos y responder a los comandos con resultados de consultas en lugar de información y descripciones como un servidor Microsoft SQL. Aún más emocionante, sin embargo, es que los desarrolladores que utilizan LLM disponibles en la nube pública pueden tomar código de software sensible fuera de la red corporativa y, por lo tanto, socavar la seguridad. El proyecto piloto DB-GPT de código abierto disponible en GitHub ofrece una solución a este problema con modelos nativos de lenguaje grande que las empresas pueden usar al 100 % en su entorno de datos y TI seguro.
La seguridad también aumenta con el asistente de IA líder de Atlan, que ayuda con la gestión de datos, la colaboración de los equipos relevantes de la empresa y la preparación completa de la documentación, mientras que la IA de Lume simplifica la integración de datos mediante la transformación automática de datagramas. En el otro extremo del espectro, Stemma AI Discover Assistant facilita a los usuarios comerciales comprender las tendencias a través de las capacidades de descubrimiento de datos, ya sean fluctuaciones de ingresos, retención de clientes u oportunidades de mejora del servicio en cualquier industria.
Seguridad en el punto de mira
En otra presentación del día de clausura del Budapest Data + ML Forum 2023, Bence Arató también hizo una breve descripción de las tendencias que actualmente definen el campo de la IA. Según uno de los informes de proveedores que cité (Informe de preparación de IA de Scale 2023), el espectacular desarrollo de los modelos generativos que se pusieron a prueba el año pasado tuvo un tremendo impacto en las estrategias de IA de las empresas. El sesenta y cinco por ciento de los clientes de Scale dijeron que, como resultado de esta tendencia, han acelerado la implementación de su estrategia existente o han desarrollado este plan de desarrollo por primera vez. Pero mientras que el 60 por ciento de los encuestados está experimentando con modelos generativos, o se está preparando para hacerlo en los próximos 12 meses, solo una quinta parte (21 por ciento) está utilizando actualmente dichos modelos en entornos de producción.
La atención se centra cada vez más en la seguridad en los principales laboratorios de IA, ya que la cantidad de investigadores que trabajan en el campo se ha más que triplicado en un año, según la edición de 2022 del informe State of AI preparado por inversores. El informe también señala que desde 2010, los centros de investigación chinos han publicado cuatro veces y media más trabajos científicos que instituciones comparables en Estados Unidos, India, Inglaterra y Alemania juntos. Además, China lidera áreas de investigación como la videovigilancia, la detección de objetos, la interpretación de situaciones y el control autónomo, que pueden influir no solo en la seguridad, sino también en las condiciones geopolíticas.
El Informe anual de la Universidad de Stanford (Índice AI 2023) también llama la atención sobre los riesgos de seguridad, así como varias otras tendencias; por ejemplo, el sector académico se está quedando atrás de la competencia. Entre otras cosas, cita los resultados de la encuesta IPSOS del año pasado, según la cual el porcentaje más alto (78 por ciento) de ciudadanos chinos tiene una opinión positiva sobre los productos y servicios de IA, mientras que en Estados Unidos solo el 35 por ciento de los encuestados dijo que la Las ventajas de la tecnología son mayores que sus desventajas. . Al examinar la práctica legislativa de 127 países, la universidad también descubrió que la cantidad de leyes que se refieren a la IA aumentó de una a 37 desde 2016, y la tecnología ya se ha incluido en la agenda de los parlamentos de 81 países. Dada la próxima ley de inteligencia artificial de la UE, que muchos esperan que tenga un impacto similar en el Reglamento General de Protección de Datos (GDPR), estas cifras pueden aumentar significativamente en un futuro próximo.
En una entrevista con Forbes en febrero pasado, Bill Gates describió los últimos 12 meses de inteligencia artificial como un hito importante en la historia de la tecnología digital como el advenimiento de la computadora personal, las interfaces gráficas de usuario e Internet.
Pero recuerda lo que el CEO de OpenAI, Sam Altman, escribió en un tuit hace un par de meses: ChatGPT es increíblemente limitado, pero sigue siendo lo suficientemente bueno en algunas cosas como para dar una impresión engañosa de grandeza. Ahora sería un error confiar en él para cualquier asunto importante. Muestra la tendencia del desarrollo. Todavía tenemos que trabajar mucho en su credibilidad y honestidad.
«Quiero ser un aficionado a la televisión. Entusiasta certificado de la cultura pop. Académico de Twitter. Estudiante aficionado».