Home Tecnología La IA ya es parte de las tuberías de Linux, les guste...

La IA ya es parte de las tuberías de Linux, les guste o no a los desarrolladores

47
0

Nostal6ie a través de iStock / Getty Photographs Plus

Siga ZDNET: Agréganos como fuente preferida en Google.


Conclusiones clave de ZDNET

  • Los desarrolladores del kernel de Linux están utilizando IA para respaldar el mantenimiento de proyectos.
  • Escribir código kernel con IA sigue siendo una cuestión abierta.
  • Aún persisten preocupaciones sobre los derechos de autor y las licencias de código abierto.

La comunidad de desarrolladores de Linux ha pasado rápidamente de debatir cómo utilizar la IA a integrarla discretamente en los flujos de trabajo de ingeniería del kernel de Linux. De hecho, Linus Torvalds ahora se describe a sí mismo como “un gran creyente” en la IA como herramienta de mantenimiento.

Al mismo tiempo, los desarrolladores del kernel se reunieron en Tokio para Cumbre de Código Abierto (OSS) Japón, Cumbre de mantenedores del kernel de Linuxy Plomeros Linux estaban formalizando cómo los modelos de lenguajes grandes (LLM) encajarán en procesos a largo plazo, como el backporting estable, la clasificación de vulnerabilidades y exposiciones comunes (CVE) y la política de herramientas.

También: Por qué los agentes de IA no lograron tomar el management en 2025: es “una historia tan antigua como el tiempo”, cube Deloitte

Como dijo Torvalds en su discurso de apertura de OSS Japón, la IA finalmente ha llegado al punto en el que es realmente útil para los mantenedores de Linux, en lugar de simplemente exagerar la generación de código. Enfatizó que su interés radica en los sistemas de inteligencia synthetic que analizan previamente los parches y fusiones, sacando a la luz los problemas antes de que lleguen a su bandeja de entrada, en lugar de las herramientas que intentan escribir código de núcleo complejo directamente. La IA aún no está preparada para eso.

Antes de las conferencias, Sasha Levin, una distinguida ingeniera de NVIDIA y mantenedora del kernel estable, había explicado dónde Los mantenedores y desarrolladores del kernel de Linux ya tenían un acuerdo sobre el uso de la IA: La responsabilidad humana no es negociable; se necesita alguna forma de divulgación cuando se utiliza IA; y los mantenedores decidirán por sí mismos cómo utilizar las herramientas de IA.

Los mantenedores aún no han llegado a un consenso sobre algunas cuestiones. Por ejemplo, ¿la IA comete tipos de errores fundamentalmente diferentes a los de los humanos? ¿Debería el trabajo de la IA someterse a un estándar diferente al del código producido por humanos? ¿Y cuáles son las ramificaciones legales de introducir código de IA en el núcleo?

También: Esta nueva plataforma Linux le permitirá actualizar su próximo automóvil en casa, a partir de 2027

Este último es un tema candente. Aún no se ha resuelto cómo se mezclan los derechos de autor y la IA. Grandes demandas siguen abriéndose camino en los tribunales. Para complicar las cosas, es bien sabido que las herramientas de codificación de IA se entrenaron en gran medida en código fuente abierto bajo una variedad de licencias de código abierto diferentes.

Usar LLM en trabajos ingratos

A principios de este año, Levin reveló que ya había telegrafiado LLM en dos de los trabajos más ingratos del proyecto: identificar backports y correcciones de seguridad. Para AUTOSELel sistema que identifica parches del kernel para realizar backports a versiones estables, Levin reconstruyó el motor de selección en torno a incrustaciones, tratando cada confirmación como un punto en un espacio semántico y pidiendo a los LLM que encontraran parches similares a backports anteriores. El sistema distribuye consultas a múltiples modelos, les permite “votar” y luego entrega los candidatos preseleccionados a mantenedores humanos, actuando efectivamente como un mantenedor additional estable que nunca olvida las decisiones históricas.

La misma infraestructura sustenta ahora Flujo de trabajo CVE interno de Linuxque asumió la responsabilidad de asignar sus propios números CVE a principios de 2024. El equipo de CVE reemplazó los frágiles scripts de shell con herramientas Rust redactadas en gran medida con ayuda de LLM. Levin utilizó IA tanto para generar código como para ayudar a clasificar qué confirmaciones probablemente sean relevantes para la seguridad. Levin sostiene que estas herramientas no reemplazan el juicio humano, pero hacen posible un proceso de clasificación que de otro modo no sería escalable y que dura siete días a la semana a medida que el volumen de parches del kernel continúa creciendo. El agotamiento de los mantenedores de Linux es una preocupación grave y conocida. Es un trabajo ingrato.

También: La solución para los desordenados ecosistemas de agentes de IA podría finalmente estar aquí, y es de código abierto

Levin también dijo que se fusionó un parche para Linux 6.15, que se le atribuye pero que fue generado en su totalidad por IA, con registro de cambios y pruebas incluidas. El parche, un cambio pequeño pero no trivial en la tabla hashdemostró, en su opinión, lo que la IA hace bien: transformaciones mecánicas de alcance limitado en las que el modelo puede razonar sobre campos de bits. Añadió que la IA realiza pruebas con más paciencia que un humano cansado. Los desarrolladores del kernel ahora utilizan a diario un script git-resolve independiente generado por IA, agregado en 6.16 para resolver ID de confirmación ambiguas y enviado con autopruebas y documentación inusualmente exhaustivas.

Pero el parche hash escrito por IA también contenía un error sutil: eliminó un atributo __read_mostly, una sugerencia de rendimiento que debería haberse conservado, lo que provocó una ola de críticas una vez que la omisión fue analizada en los hilos de comentarios de la LWN. Los comentaristas también argumentaron que la autoría no revelada de AI viola la Certificado de origen del desarrollador y expectativas de la comunidad en cuanto a honestidad y revisión.

El propio Torvalds dijo más tarde que habría examinado el cambio más cuidadosamente si hubiera sabido que fue generado 100% por herramientas. Es por eso que se requerirá una etiqueta o divulgación explícita cuando los programadores entreguen parches de código derivados de IA.

En OSS Japón, Torvalds dijo que cree que los LLM deberían ser tratados como el siguiente paso en la evolución de los compiladores en lugar de reemplazos humanos. Comparó su adopción con el cambio de lenguajes ensambladores a lenguajes de nivel superior: inicialmente controvertido, pero finalmente aceptado como una forma de liberar a los desarrolladores de trabajos pesados ​​como escribir textos repetitivos o redactar meticulosamente mensajes de confirmación en un segundo idioma. En la práctica, los desarrolladores ya están utilizando los LLM como potentes linters y resumidores tanto para código como para correo electrónico.

También: La herramienta de línea de comandos de Gemini cambia las reglas del juego de la productividad y es gratuita: cómo la uso

Algunos mantenedores también me dijeron que la preselección impulsada por IA puede reducir la clasificación de parches de un día a minutos. Para aquellos de ustedes que no lo saben, el proceso de desarrollo del kernel de Linux se ejecuta en listas de correo, específicamente en Lista de correo del kernel de Linux (LKML). Esto supone un enorme ahorro de tiempo y energía. Shuah Khan, miembro de la Fundación Linux, estuvo de acuerdo en que la IA ha demostrado ser muy útil para revisar y mejorar la productividad.

Más allá de las herramientas para desarrolladores, el ecosistema Linux más amplio también se está moviendo hacia cargas de trabajo de IA y operaciones asistidas por IA. Los proveedores de {hardware} están compitiendo para exponer aceleradores y NPU a Linux. Al mismo tiempo, se están ajustando el almacenamiento y los sistemas de archivos para alimentar los canales de GPU a escala. Paralelamente, proyectos fuera del núcleo, provenientes de experimentos académicos como Encuesta de código a ofertas comerciales, están explorando cómo los LLM pueden mapear grandes bases de código, rastrear ciclos de vida de funciones y descubrir subsistemas con muchos errores mediante la extracción de confirmaciones y listas de correo.

No todos están convencidos

A pesar de los informes entusiastas, todavía no todo el mundo está convencido de la IA. Un mantenedor senior dijo, si bien la experiencia de la mayoría de las personas con la IA se sintió falsamente positiva. Escuchamos inquietudes y estamos trabajando para incorporar la IA a nuestros procesos de manera responsable. Es algo que definitivamente puede ayudar a reducir la carga para los mantenedores y desarrolladores. Por otro lado, debemos tener mucho cuidado al incorporar algo tan nuevo y que actualmente es propietario de nuestro flujo de trabajo.

También: He probado herramientas de codificación de IA gratuitas y de pago: esta es cuál usaría realmente

Jonathan Corbet, desarrollador senior del kernel y editor en jefe de LWNagregó que le preocupaba que los mantenedores “dependeran de herramientas propietarias. Si nos volvemos dependientes de esto para nuestro proceso de revisión, realmente corremos el riesgo de repetir el desastre de BitKeeper de hace 20 años”. BitKeeper fue el primer sistema de gestión de management de código fuente (SCM) utilizado para rastrear el código de Linux. Su creador cambió su licencia para que ya no pudiera usarse para Linux. El resultado, aunque maravilloso a largo plazo (causó que Torvalds creara Git), fue extremadamente perturbador en ese momento.

Otra preocupación compartida por Shuah y Dan Williams, ingeniero principal senior de Intel y mantenedor del kernel, es cómo garantizar que los nuevos desarrolladores realmente entiendan lo que están haciendo. Williams dijo: “Hago charlas sobre carreras en las escuelas secundarias y les digo que lo más importante que puedes aprender en la escuela, y que usarás, es ‘mostrar tu trabajo'”. Y siento que la IA es lo máximo: ‘No tengo que mostrar mi trabajo porque la IA me dijo que es correcto'”. Eso no ayuda.

También: Malas vibraciones: cómo un agente de IA codificó su camino hacia el desastre

Este es un problema actual tanto para las personas que aprenden a codificar como para las personas que quieren pasar de ser codificadores principiantes a programadores maduros. Como dijo Stefania Druga, científica investigadora de Sakana AI y ex científica investigadora de IA en Google DeepMind, en una presentación de OSS Japón, las herramientas de IA están automatizando muchas de las tareas junior que alguna vez sirvieron como trampolines para los recién llegados.

“Necesitamos experiencia para conseguir un trabajo, y un trabajo para conseguir esa experiencia”, dijo. “Si La IA va a automatizar estas tareas básicas, ¿cómo se supone que las personas reales aprenderán estas habilidades?” Buena pregunta, que todos los estudiantes, empleadores y desarrolladores del kernel de Linux deben abordar.

Ese es un problema futuro.

Quedan preguntas

Hoy en día, las tendencias convergen en la misma conclusión: la IA se está convirtiendo en parte de las tuberías de Linux en lugar de un truco incorporado. Por ahora, la atención se centra directamente en aumentar los mantenedores bajo cargas de parches abrumadoras, automatizar las partes más tediosas del trabajo estable y de seguridad y capturar los beneficios de las máquinas de coincidencia de patrones.

También: Por qué la gente seguirá recurriendo a Linux en 2025 (y no es sólo para escapar de Home windows)

¿Escribirá la IA eventualmente partes sustanciales del código de Linux? Manténganse al tanto. Esa pregunta sigue sin respuesta y su resolución puede terminar dependiendo más de la ley de derechos de autor que de la experiencia técnica.



avotas