24 de diciembre de 2025 · 14 min de lectura ·

ia gemini revision-codigo testing aprendiendo-en-publico

Probé Usar IA para Revisión de Código en Mis Proyectos (3 Semanas, Resultados Reales)

Tres semanas combinando Gemini Flash y Claude Code en proyectos personales: el 90% de mis tests los escribe la IA y voy 3-4x más rápido. Qué falló. →

Óscar Gallego

Desarrollador Web

Flujo de trabajo con Gemini Flash y Claude Code para desarrolladores

En este artículo

La versión corta, tras tres semanas

El setup: desarrollador trabajando solo, unos 3 años de experiencia, Google One Pro (pagaba por el almacenamiento, resulta que incluye Gemini) más Claude Code, en proyectos personales.

Los resultados: el 90% de mis tests ahora los genera la IA pero los reviso a mano, las features salen 3-4x más rápido, y el reparto que se quedó es Claude Code para planificar, Gemini Flash para ejecutar. Sigo alcanzando los límites de uso regularmente.

El pero: lo revisas todo. La IA comete errores, y este flujo solo sobrevive en proyectos personales donde puedo permitirme cazar mis propios bugs.

¿Vale la pena probarlo? Si trabajas solo, en proyectos personales, y odias el código repetitivo: sí. Si trabajas en sistemas críticos o no puedes revisar el output de la IA con cuidado: no.

¿Quién soy yo para contarte esto?

Llevo unos 3 años programando. No soy ingeniero senior. No gestiono equipos. No trabajo en FAANG.

Soy un desarrollador construyendo proyectos personales, intentando lanzar más rápido, y trasteando con herramientas de IA para ver si de verdad ayudan.

Así que no leas esto como una guía definitiva ni como las mejores prácticas de un ingeniero 10x. Son tres semanas de probar cosas: qué funcionó, qué no, qué me sorprendió. Si estás en una situación parecida (desarrollador solo, proyectos personales, tiempo limitado), quizá te ahorre el experimento.

Desarrollar solo es lento porque lo aburrido también te toca a ti

Cuando trabajas en proyectos personales solo, todo cae sobre ti:

Escribir todo el código
Escribir todos los tests (aburrido)
Manejar todo el styling (tedioso)
Arreglar todos los bugs
Revisar tu propio código (ya sabemos cómo va eso)

¿Y honestamente? Escribir tests es repetitivo. Ajustar clases de Tailwind durante horas atonta. Detectar mis propios bugs es hit-or-miss.

Yo quería mi tiempo en las partes interesantes, construir features y resolver problemas, no en lo mecánico.

Lo que probé, con expectativas bajas

Había escuchado a gente hypeando las herramientas de IA para programar y yo era escéptico. “Probablemente está sobrevalorado”, pensé.

Pero ya tenía una suscripción de Google One Pro (por el almacenamiento, no por la IA), que incluye Gemini. Y la gente no paraba de hablar de Claude Code. Así que: probarlo unas semanas y ver qué pasa.

Peor caso, pierdo algo de tiempo. Mejor caso, aprendo algo útil.

Por qué Gemini Flash en concreto

Cuando Google lanzó Gemini 3 Flash, todos asumieron que era la versión “lite” de Pro. Más rápido pero menos inteligente. El trade-off de siempre.

Excepto que los benchmarks decían lo contrario.

SWE-bench Verified (prueba IA con issues reales de GitHub de proyectos open-source):

Modelo	SWE-bench Verified	Coste (API, in / out)
Gemini 3 Flash	78%	$0.50 / $3 por 1M
Gemini 3 Pro	76.2%	$2 / $12 por 1M

Flash puntúa más alto que Pro, corre unas 3x más rápido que Gemini 2.5 Pro (según los números de Artificial Analysis de Google), y cuesta más o menos 4x menos que 3 Pro tanto en input como en output. Lo bastante raro como para probarlo.

(Nota: uso Google One Pro, no la API, así que no pago estas tarifas. Pero sí alcanzo los límites de uso regularmente.)

El combo que funcionó: Claude Code piensa, Gemini Flash teclea

Aquí está la cosa: no estoy usando Gemini Flash solo.

Después de una semana de experimentar, este es el reparto que de verdad me funciona.

El flujo híbrido

1. Claude Code para planificación e investigación.

“Investiga la mejor forma de testear este componente de React”
“Dame un plan de implementación para [feature]”
“¿Cuáles son los edge cases que debería manejar?”

Claude Code tarda más pero piensa a fondo. Bueno para decisiones arquitectónicas y planificación.

2. Gemini Flash para ejecución.

“Aquí está el plan que Claude me dio. Impleméntalo.”
“Escribe tests para estas funciones siguiendo este enfoque”
“Estiliza este componente para que coincida con este diseño”

Gemini Flash ejecuta increíblemente rápido. A veces no piensa suficiente, pero para eso está el plan.

¿Por separado? Meh. ¿Juntos? Realmente útil.

Por qué el combo se sostiene

Claude Code es lento pero exhaustivo, justo lo que quieres para arquitectura. Gemini Flash es rápido pero a veces superficial, justo lo que quieres para implementar un plan que ya existe.

Claude Code: “Así es CÓMO deberíamos resolver esto y POR QUÉ.” Gemini Flash: “Entendido, implementando ahora.”

Una herramienta planifica, la otra teclea. Ese reparto del trabajo es más fiable que apoyarse en una sola.

Una feature real: de 6.5 horas a 45 minutos

Así es como funciona esto en la práctica, en mi propio portfolio.

Cómo trabajaba antes

Construyendo una nueva feature para el blog:

Investigar mejores prácticas: 1 hora
Planificar implementación: 30 min
Escribir el código: 2 horas
Escribir tests: 1.5 horas (ugh)
Estilos con Tailwind: 1 hora
Arreglar bugs: 30 min

Total: ~6.5 horas.

La misma feature, con el combo

Pregunto a Claude Code (5 min):

"Quiero añadir un indicador de progreso de lectura a los posts del blog.
¿Cuál es el mejor enfoque? Considera rendimiento y accesibilidad."

Claude me da un plan: scroll event listener, throttling, etiquetas ARIA, etc.

Le paso el plan a Gemini Flash (10 min):

"Implementa este indicador de progreso de lectura siguiendo este plan:
[pego el plan de Claude]

Tech stack: Astro, TypeScript, Tailwind"

Flash genera el código del componente en segundos.

Revisar y refinar (15 min): comprobar que el código tiene sentido, arreglar lo obvio, testear a mano.
Generar tests con Gemini Flash (5 min):

"Escribe tests para este componente. Verifica:
- El progreso se actualiza al hacer scroll
- Maneja edge cases (arriba/abajo de la página)
- Los atributos de accesibilidad están presentes"

Revisión final (10 min): ejecutar los tests, ajustar estilos si hace falta, listo.

Total: ~45 minutos.

De 6.5 horas a 45 minutos. Sin magia: simplemente dejé de gastar mis tardes en las partes mecánicas de programar.

Dónde compensa de verdad

Tests: yo escribo la función, la IA escribe la suite

El 90% de mis tests ahora los escribe la IA. Yo reviso cada uno.

// Yo escribo esta función
function calculateReadingTime(content: string): number {
  const wordsPerMinute = 200;
  const words = content.split(/\s+/).length;
  return Math.ceil(words / wordsPerMinute);
}

// Pregunto a Gemini Flash: "Escribe tests para calculateReadingTime"
// Genera 8 casos de test en 10 segundos

¿Son perfectos? No. A veces los arreglo. Pero le saca mucha distancia a escribirlos desde cero.

Clases de Tailwind sin la pestaña de docs

Le muestro a Gemini una captura o una descripción de lo que quiero, y me devuelve las clases de Tailwind.

Yo: "Crea un componente de tarjeta con:
- Sombra sutil
- Esquinas redondeadas
- Efecto hover que la levante ligeramente
- Soporte para dark mode"

Gemini: [me da las clases exactas de Tailwind]

Yo: [ajusto 2-3 clases, listo]

Me ahorra estar buscando constantemente en la documentación de Tailwind.

Tres enfoques desechables en minutos

¿Necesitas probar 3 enfoques diferentes? La IA genera los 3 en minutos.

Elijo el mejor y lo refino. Mucho más rápido que codificar los tres a mano.

La parte honesta: dónde se cae

Los límites de Google One Pro llegan rápido

Alcanzo los límites de uso bastante a menudo. Cuando pasa, o espero a que se resetee el límite (molesto), o cambio a Claude Code (que tiene sus propios límites), o lo hago a mano (anula el propósito).

Seamos realistas: si planeas usar esto intensivamente, Google One Pro puede no ser suficiente. La API con pago por uso sería mejor, pero cuesta dinero.

Flash a veces es demasiado rápido para su propio bien

Me da código que funciona pero se pierde edge cases. O sugiere un enfoque técnicamente correcto pero sobrecomplicado para mi caso de uso.

Justo por eso Claude Code planifica primero. Claude piensa más profundo, Flash ejecuta más rápido.

Sigues revisando todo

La IA comete errores. A veces sutiles.

La semana pasada, Gemini generó un test que se veía perfecto pero en realidad estaba probando lo incorrecto. Solo lo cacé porque leí el test con calma.

Si confías ciegamente en código generado por IA, vas a lanzar bugs. Reviso cada línea antes de hacer commit. No negociable.

Lo específico del dominio es hit-or-miss

¿Código genérico? La IA lo maneja bien. ¿Tu lógica de negocio concreta? No tanto.

Ejemplo: mi blog tiene un sistema de formateo de fechas personalizado. La IA insistía en que usara una librería en su lugar. Técnicamente correcto, pero no lo que yo quería. Tuve que añadirlo al prompt: “No sugieras librerías para esto, solo implementa la lógica personalizada.”

Mi setup real (sin GitHub Actions ni API keys)

Uso Google One Pro en el navegador, así que el flujo entero son cuatro fases.

1. Planificación (Claude Code)

Abro Claude Code (web o app) y pregunto:

"Necesito [describir feature].

Tech stack: [tu stack]

¿Cuál es el mejor enfoque? Piensa en:
- Pasos de implementación
- Edge cases
- Estrategia de testing
- Problemas potenciales"

Claude me da un plan detallado. Lo guardo o mantengo el chat abierto.

2. Implementación (Gemini Flash)

Copio el plan de Claude en Gemini Flash:

"Implementa esta feature siguiendo este plan:

[pego el plan de Claude]

Tech stack: [tu stack]
Archivos a modificar: [lista archivos]

Genera la implementación completa."

Gemini genera código rápido. Lo copio en mi editor.

3. Testing (Gemini Flash)

"Escribe tests completos para este código:

[pego el código]

Usa [tu framework de tests]
Cubre edge cases y escenarios de error"

Gemini genera tests. Los reviso y los añado a mi suite.

4. Revisar y refinar (yo)

Leo todo el código generado. Busco bugs. Testeo a mano. Arreglo lo que esté mal. Commit cuando todo funciona.

Tiempo total para una feature típica: 30-60 minutos en lugar de 4-6 horas.

Los números tras tres semanas

Métricas reales de mi portfolio y proyectos personales.

Código generado:

Features implementadas: 12
Tests escritos: ~150 (90% generados por IA, 10% manuales)
Componentes estilizados: 8
Bugs detectados por tests de IA: 7

Comparación de tiempos:

Tarea	Antes de IA	Con IA	Ahorro
Implementación de features	4-6 horas	1 hora	75%
Escribir tests	2 horas	20 min	83%
Estilos con Tailwind	1.5 horas	15 min	83%
Investigación de bugs	Variable	Más rápido	~50%

En general: las features salen 3-4x más rápido que antes.

El pero, otra vez: esto solo funciona porque lo reviso todo. Copia y pega código de IA sin leerlo y lanzarás bugs a diestra y siniestra.

Flash vs Pro, una semana con cada uno

Gemini 3 Flash

Mejor para tareas de implementación rápidas, generación de tests, trabajo de styling y UI, y seguir un plan claro.

No tan bueno para decisiones arquitectónicas complejas, debugging profundo, o lógica de negocio densa.

Velocidad: increíblemente rápido (2-5 segundos para la mayoría de tareas). Coste: gratis con Google One Pro, con límites.

Gemini 3 Pro

Mejor para decisiones arquitectónicas, resolución de problemas complejos, análisis profundo de código, y explicar por qué algo funciona.

No tan bueno para iteraciones rápidas (tarda más) ni tareas simples (overkill).

Velocidad: más lento (~10-20 segundos). Coste: mismos límites en Google One Pro.

Mi conclusión: Flash para tareas de ejecución (más rápido, calidad suficiente), Pro para tareas de pensamiento (razonamiento más profundo). ¿Pero honestamente? Claude Code gana a ambos para planificar.

Los errores, semana a semana

Semana 1: usé solo Gemini Flash, para todo. Resultado: código rápido pero desordenado y con muchos bugs. Lección: Flash ejecuta, no planifica.

Semana 2: confié demasiado en la IA. Copié código sin revisar y lancé un bug que rompió mi formulario de contacto durante 2 días. Lección: siempre revisa el código generado por IA. Sin excepciones.

Semana 3: encontré el equilibrio. Claude Code para planificar, Gemini Flash para ejecutar, revisión exhaustiva encima. Lección: la herramienta correcta para cada trabajo.

¿Deberías probarlo?

Sí, si trabajas solo en proyectos personales, odias escribir código repetitivo, quieres lanzar más rápido, y estás dispuesto a revisar el output de la IA con cuidado.

No, si disfrutas escribiendo cada línea tú mismo (totalmente válido), no tienes tiempo para revisar código de IA, trabajas en sistemas críticos de producción que necesitan revisión humana más exhaustiva, o esperas que la IA resuelva todos tus problemas. No lo hará.

Quizás, si eres escéptico pero curioso. Justo. Prueba antes de comprometerte.

Mi recomendación honesta

No digo que esta sea LA forma de programar. Digo que me está funcionando a mí, ahora mismo, en mis proyectos personales, como alguien que todavía está aprendiendo.

Lo que funciona: desarrollo de features 3-4x más rápido, 90% de tests generados por IA (y revisados por mí), menos tiempo en lo aburrido y más en problemas interesantes.

Lo que no es perfecto: tengo que revisarlo todo, alcanzo los límites de Google One Pro, todavía estoy aprendiendo los mejores prompts, y hay tareas que la IA simplemente no maneja bien.

Después de tres semanas, estoy convencido de que vale la pena probarlo si estás dispuesto a aprender las herramientas en serio, revisar cada línea, aceptar la imperfección, y seguir ajustando.

¿Te funcionará a ti? Honestamente no lo sé. Pruébalo y verás.

Preguntas frecuentes

¿Puedo usar Gemini Flash sin pagar por Google One Pro?

Puedes usar el tier gratuito de Gemini, pero alcanzarás los límites de uso rápidamente. Google One Pro ($10/mes) te da límites más generosos. Si necesitas uso ilimitado, la API es pago por uso (Gemini 3 Flash cuesta $0.50 por millón de tokens de input y $3 por millón de tokens de output).

¿La revisión de código con IA es tan buena como la humana?

No. La IA es buena detectando errores de sintaxis, sugiriendo implementaciones, y generando tests. No entiende tu contexto específico, tu lógica de negocio, ni tus restricciones arquitectónicas. Sigo revisando todo yo mismo; la IA solo acelera las partes mecánicas.

¿Cuál es mejor: Gemini Flash o Claude Code?

Son buenos para cosas diferentes. Claude Code es mejor para planificación y decisiones arquitectónicas. Gemini Flash es mejor para ejecución rápida y generación de tests. Uso ambos juntos para mejores resultados.

¿Cuánto tiempo ahorra realmente?

Para mí, alrededor de 3-4x más rápido en desarrollo de features. Una feature que tomaba 6 horas ahora toma ~1.5 horas. Pero todavía estoy aprendiendo, así que tu experiencia puede variar.

¿Necesito saber programar para usar herramientas de IA para código?

Sí. La IA no reemplaza el conocimiento de programación, lo acelera. Necesitas entender código para revisar el output, cazar errores, y guiar a la IA. Estas herramientas funcionan mejor para desarrolladores que ya saben lo que hacen.

Llevo tres semanas con esto. Seguro que me estoy perdiendo cosas, haciendo partes de forma ineficiente, equivocándome en otras. Ese es el trato de aprender en público: publicas la versión a medio formar y dejas que la gente le busque los agujeros.

Pues búscalos.

Lectura relacionada: si estás eligiendo modelo de Gemini para este flujo, empieza por la guía de Gemini 3 para desarrolladores.

P.D. ¿Has probado herramientas de IA para programar? ¿Qué flujo te funciona, y en qué me estoy equivocando? Cuéntamelo en Twitter/X. Y si pruebas este setup, quiero saber cómo te va, sobre todo las partes que no funcionan.