



const fs = require('fs');
const path = require('path');
const main = async () => {
const response = await fetch('https://api.ai.cc/v1/images/generations', {
method: 'POST',
headers: {
Authorization: 'Bearer ',
'Content-Type': 'application/json',
},
body: JSON.stringify({
prompt: 'A jellyfish in the ocean',
model: 'imagen-3.0-generate-002',
}),
}).then((res) => res.json());
response['data'].forEach((image, i) => {
const buffer = Buffer.from(image['url'], 'base64');
fs.writeFileSync(path.join(__dirname, `image_${i + 1}.png`), buffer);
});
};
main();
import requests
def main():
response = requests.post(
"https://api.ai.cc/v1/images/generations",
headers={
"Authorization": "Bearer ",
"Content-Type": "application/json",
},
json={
"prompt": "A jellyfish in the ocean",
"model": "imagen-3.0-generate-002",
},
)
response.raise_for_status()
data = response.json()
for i, image in enumerate(data["data"]):
with open(f"image_{i+1}.png", "wb") as f:
f.write(base64.b64decode(image["url"]))
if __name__ == "__main__":
main()

Detalle del producto
✨ Introduction to Imagen 3
Imagen 3 es el innovador modelo de IA de texto a imagen de Google, que revoluciona la forma en que creamos imágenes fotorrealistas a partir de descripciones de texto simples. Lanzado en Julio de 2024Esta versión amplía sus predecesoras ofreciendo un nivel de detalle e iluminación inigualables, así como una sorprendente reducción de artefactos visuales. Establece un nuevo estándar para la comprensión del lenguaje natural e introduce una representación de texto significativamente mejorada en las imágenes, abriendo un mundo de posibilidades creativas.
Imagen 3 es el último modelo de IA de texto a imagen de Google, diseñado para generar imágenes fotorrealistas de alta calidad a partir de descripciones de texto con detalles mejorados, iluminación y menos artefactos.
— Citado de Descripción de la imagen original 3
🔑 Características principales de Imagen 3
- ✨ Generación de imágenes de alta calidad: Crea imágenes realistas con detalles excepcionales, iluminación más rica y artefactos visuales mínimos.
- 💡 Comprensión mejorada del lenguaje natural: Se mejoró significativamente la capacidad para interpretar indicaciones complejas, lo que reduce la necesidad de una ingeniería de indicaciones elaborada.
- ✍️ Mejor representación del texto: Ofrece una representación de texto superior dentro de las imágenes generadas, ampliando las aplicaciones creativas.
- 🧠 Conciencia contextual y coherencia: Emplea un sofisticado mecanismo de composición de escena para garantizar la coherencia lógica en las imágenes generadas.
- 🔍Mayor resolución y realismo: Genera imágenes de ultra alta definición que son prácticamente indistinguibles de las fotografías reales.
Casos de uso previstos
Imagen 3 es ideal para generar imágenes realistas a partir de descripciones de texto en diversas aplicaciones, incluidas marketing, publicidad, diseño y proyectos creativosEs ideal para empresas que requieren elementos visuales personalizados y para desarrolladores que crean aplicaciones que exigen capacidades de generación de imágenes de alta calidad.
⚙️ Detalles técnicos
- Arquitectura: Aprovecha un enfoque de aprendizaje profundo, combinando un modelo de lenguaje (como el T5 de Google) con una red generativa antagónica (GAN) o un modelo de difusión.
- Datos de entrenamiento: Entrenado en conjuntos de datos masivos de pares texto-imagen, con subtítulos enriquecidos para capturar matices más finos.
- Diversidad y sesgo: Incorpora un amplio filtrado y etiquetado de datos para minimizar el contenido dañino en el conjunto de datos de entrenamiento, lo que garantiza una generación de IA responsable.
📈 Métricas de rendimiento
- Calidad visual: Logra las puntuaciones más altas en calidad visual, produciendo imágenes atractivas y en gran medida libres de artefactos.
- Precisión inmediata: Demuestra gran precisión al responder a indicaciones complejas.
📊 Comparación con otros modelos
La evaluación humana en GenAI-Bench muestra consistentemente el desempeño superior de Imagen 3 en los puntos de referencia de preferencia general en comparación con otros modelos líderes.


🚀 Introducción a Imagen 3
Ejemplos de código:
Integre Imagen 3 en sus aplicaciones usando los fragmentos de código proporcionados. Las imágenes generadas se guardarán directamente en su computadora.
Parámetros para la generación de imágenes:
- num_imágenes [int]: Especifica el número de imágenes a generar.
- semilla [int]: Establece la semilla aleatoria para la generación de imágenes reproducibles.
- enhancement_prompt [booleano]: Parámetro opcional para utilizar una función de reescritura de indicaciones basada en LLM para obtener imágenes de mayor calidad que se ajusten mejor a la intención de la indicación original. Deshabilitar esta función puede afectar la calidad y la adherencia de la imagen.
- convertir_base64_a_url [booleano]: Si es verdadero, se devolverá la URL de la imagen; de lo contrario, el archivo de imagen se proporcionará en formato base64.
- relación de aspecto [1:1, 9:16, 16:9, 3:4, 4:3]: Define la relación de aspecto de la imagen generada.
- persona_generación [no_permitir, permitir_adulto]: Controla la generación de personas por el modelo.
- configuración de seguridad [bloque bajo y superior, bloque medio y superior, bloque solo alto]: Añade un nivel de filtro a los mecanismos de seguridad.
Formato de respuesta esperado:
Tras la generación exitosa, recibirá una respuesta JSON similar a esta:
{ "datos" : [ { "tipo_mime" : "imagen/png" , "url" : "imagen/url base64" , "prompt" : "mensaje mejorado" } ] } El modelo está disponible en el Plataforma API de IA/ML bajo el nombre "Imagen 3".
Documentación completa de API:
Detallado Documentación de la API Está disponible para desarrolladores que buscan información detallada.
🛡️ Pautas éticas e IA responsable
- Seguridad ante todo: Desarrollado con máxima seguridad y responsabilidad en mente, adhiriéndose estrictamente a los Principios de IA de Google.
- Marca de agua digital (SynthID): Incluye SynthID para identificar claramente el contenido generado por IA, lo que promueve la transparencia.
- Prevención de contenido dañino: Emplea filtros de seguridad avanzados para prevenir rigurosamente la generación de contenido dañino.
- Gobernanza de datos: Utiliza políticas sólidas de gobernanza de datos, garantizando que los datos de los clientes nunca se utilicen con fines de capacitación.
📄 Licencias y uso
Al usar Imagen 3, es fundamental cumplir con las directrices de uso e inteligencia artificial responsable de Google. Para situaciones específicas, como la generación de imágenes con personas, podrían requerirse aprobaciones adicionales de Google. Si su proyecto implica la creación de este tipo de imágenes, asegúrese de seguir los procesos de aprobación necesarios.
Accede a la API de Imagen 3 y comienza tu viaje creativo aquí.
❓ Preguntas frecuentes (FAQ)
-
P1: ¿Qué es Imagen 3?
A1: Imagen 3 es el último modelo de inteligencia artificial de texto a imagen de Google, lanzado en julio de 2024, diseñado para generar imágenes fotorrealistas de alta calidad a partir de descripciones de texto con detalles mejorados, iluminación y comprensión del lenguaje natural.
-
P2: ¿En qué mejora Imagen 3 respecto a versiones anteriores?
A2: Ofrece una calidad de imagen superior, una iluminación más rica, menos artefactos visuales, una mejor comprensión de indicaciones complejas, una representación mejorada del texto dentro de las imágenes y una generación de mayor resolución.
-
P3: ¿Puedo utilizar Imagen 3 para proyectos comerciales?
A3: Sí, Imagen 3 está diseñado para diversas aplicaciones, como marketing, publicidad y diseño. Sin embargo, usos específicos, como la generación de imágenes de personas, podrían requerir aprobaciones adicionales de Google.
-
P4: ¿Qué medidas existen para el uso ético de la IA?
A4: Imagen 3 incorpora marca de agua digital (SynthID), emplea filtros de seguridad para evitar contenido dañino y sigue políticas sólidas de gobernanza de datos, alineadas con los Principios de IA de Google.
-
Q5: ¿Dónde puedo acceder a la API de Imagen 3?
A5: La API de Imagen 3 está disponible en Plataforma API de IA/MLPuede encontrar documentación detallada de la API aquí.
Patio de juegos de IA



Acceso