Las redes sociales estas semanas estallaron con las imágenes de Studio Ghibli, ahora ChatGPT lanzó una nueva propuesta “Action Man”.
Tras el fenómeno viral de las imágenes al estilo Studio Ghibli, ChatGPT vuelve a sorprender a los usuarios con una nueva tendencia: la creación de muñecos “Action Man” personalizados a partir de fotografías.
La plataforma de inteligencia artificial de OpenAI permite generar imágenes hiperrealistas de figuras de acción en sus empaques originales, con accesorios detallados.
Para unirse a esta nueva tendencia, los usuarios deben acceder a ChatGPT Plus, la versión de pago que incluye el modelo GPT-4o, y seguir estos pasos:
Subir una fotografía: Se recomienda utilizar una imagen de cuerpo entero de la persona que se desea convertir en muñeco.
Introducir un “prompt” detallado: La clave para obtener un resultado óptimo es proporcionar instrucciones precisas a la IA. Un ejemplo de prompt podría ser: “Crea una figura de acción realista de la persona en la foto. Incluye accesorios como [enumerar dos o tres objetos]. Escribe [nombre de la figura de acción] en la parte superior del empaque. Estilo realista”.
Personalizar el resultado: Los usuarios pueden modificar el prompt para agregar detalles específicos y obtener un muñeco aún más personalizado.
I took this picture and asked it to make it into an action figure. It’s incredible that ChatGPT can now do this so ‘matter-of-factly’ and without any hesitation or compunctions.
ChatGPT: De Ghibli a “Action Man”, un Éxito Viral Constante
Esta nueva funcionalidad se suma al reciente boom de las imágenes estilo Studio Ghibli, que generó un récord de usuarios en ChatGPT. Según Sam Altman, CEO de OpenAI, la plataforma registró un millón de usuarios en una sola hora, lo que provocó la sobrecarga de los servidores y la limitación temporal de la función.
Google lanzó Gemini Flash 2.0, la IA que restaura, modifica y crea imágenes, la nueva herramienta para editar sin experiencia.
Google ha presentado la última actualización de su inteligencia artificial, llamada Gemini Flash 2.0, que promete revolucionar el mercado de la edición y manipulación de imágenes. Esta nueva versión no solo crea imágenes desde cero, sino que también ofrece funciones avanzadas como la restauración de fotos antiguas, la modificación de objetos y el ajuste de la iluminación, todo ello sin comprometer la calidad de las imágenes.
Las capacidades de Gemini Flash 2.0 podrían convertirla en un fuerte competidor para aplicaciones de fotografía líderes en el mercado, como Adobe Photoshop, Adobe Lightroom y Canva. La IA de Google ofrece una gama de herramientas que simplifican y mejoran el proceso de edición, permitiendo a los usuarios obtener resultados profesionales con mayor facilidad.
Funciones avanzadas y controversias:
Entre las funciones destacadas de Gemini Flash 2.0 se encuentran:
Creación de imágenes: Generación de imágenes desde cero a partir de descripciones textuales.
Restauración de imágenes antiguas: Recuperación de fotos deterioradas o dañadas.
Modificación de objetos: Alteración o eliminación de elementos dentro de una imagen.
Ajuste de la iluminación: Corrección y mejora de la iluminación en las fotos.
Sin embargo, la herramienta también ha generado controversia debido a su capacidad para borrar marcas de agua, lo que plantea riesgos legales relacionados con la infracción de derechos de autor. Google ha implementado restricciones para mitigar este problema, pero su eficacia aún está en evaluación.
Acceso y disponibilidad:
Gemini Flash 2.0 se encuentra disponible en modo experimental en Google AI Studio, donde los usuarios pueden probar sus funciones de forma gratuita. A pesar de las controversias, la nueva IA de Google representa un avance significativo en el campo de la edición de imágenes y tiene el potencial de transformar la forma en que interactuamos con la fotografía digital.
Un proyecto colaborativo de la región, pretende dar respuestas y abrir paso a la independencia tecnológica lejos de los grandes modelos de IA.
La respuesta de ChatGPT sobre la cultura de la región, aunque informativa, evidenció la necesidad de un modelo de lenguaje que refleje con mayor precisión la rica diversidad del Sudamérica. Por ello, el Centro Nacional de Inteligencia Artificial (Cenia) de Chile impulsa Latam-GPT, un modelo de IA colaborativo y abierto, diseñado “de y para América Latina y el Caribe”.
Latam-GPT, que se lanzará a mediados de 2025, busca convertirse en el primer modelo de Lenguaje de Gran Escala (LLM) que capture la cultura, el lenguaje y la historia de la región. El proyecto, anunciado en la Cumbre para la Acción sobre la Inteligencia Artificial en París, cuenta con la participación de más de 30 instituciones y 60 expertos de toda Latinoamérica, así como alianzas estratégicas con países como México, Colombia, Argentina, España y Estados Unidos.
El proyecto, se trata de un modelo de Lenguaje de Gran Escala, similar al Chat-GPT o DeepSeek, cuyo objetivo principal es “reflejar la cultura, el lenguaje y la historia” de la región, ofreciendo “información más precisa y representativa de los contextos locales”.
El Cenia de Chile viene trabajando desde hace dos años en el proyecto, con el apoyo del Ministerio de Ciencia, Tecnología, Conocimiento e Innovación chileno. El esfuerzo, sin embargo, no es exclusivo de ese país.
“La importancia de este modelo radica en que permite que la cultura, la idiosincrasia, la visión de mundo que proviene de la historia de América Latina esté plasmada en un modelo de lenguaje, que es la tecnología realmente más transformadora que hemos visto en las últimas décadas”, señala Rodrigo Durán, gerente del Cenia de Chile.
“Y este ha sido un esfuerzo colaborativo, donde distintos países de la región han aportado no solamente con datos que representen esa cultura sino también con conocimiento, con expertise técnica, con su propia visión de cómo tiene que funcionar una solución de estas características”, explica.
El Cenia, con el apoyo del Ministerio de Ciencia de Chile, ha reunido 8 TB de información de bibliotecas virtuales públicas y privadas, alcanzando 50 billones de parámetros, comparable a ChatGPT-3.5. La Universidad de Tarapacá (UTA) aportará la infraestructura de alto rendimiento necesaria para entrenar el modelo, con un supercomputador que se espera esté operativo en los próximos meses.
Hacia la independencia tecnológica
Omar Florez, experto a cargo del preentrenamiento, destaca que Latam-GPT representa un paso hacia la independencia tecnológica de la región en el campo de la IA. “Históricamente Latinoamérica ha sido un espectador en esta área y este quizás es un primer paso para la independencia tecnológica de nuestra región en términos de inteligencia artificial”, dice Florez.
La ministra de Ciencia y Tecnología de Chile, Aisén Etcheverry, destaca el valor geopolítico del proyecto y afirma que “los modelos de lenguaje son la esencia de la inteligencia artificial y hoy solo son desarrollados por Estados Unidos, por China, por algunos países de Europa”.
“Contar con un modelo de lenguaje latinoamericano; que dé cuenta de nuestra cultura, de nuestro idioma, de nuestra aproximación a la vida, nos permite avanzar en una inteligencia artificial más sustentable”, sostiene.
Ulises A. Mejías, académico de la Universidad Estatal de Nueva York, se muestra escéptico sobre la capacidad de Latam-GPT para lograr una verdadera soberanía tecnológica. Plantea interrogantes sobre el impacto ambiental del entrenamiento del modelo y la protección de datos, así como la necesidad de cuestionar el propósito de la IA generativa más allá de la reducción de costos laborales.
Impacto ambiental y protección de datos
El Cenia asegura que la infraestructura de la UTA utilizará energía renovable y sistemas de refrigeración eficientes, minimizando el impacto ambiental. En cuanto a la protección de datos, se comprometen a utilizar fuentes abiertas, respetar los términos de servicio, anonimizar datos personales y cumplir con las leyes de derechos de autor.
Según explican en el Cenia de Chile, la infraestructura de la Universidad de Tarapacá tendría un consumo de 135 kWh en su primera etapa, que es lo que consumen 12 servidores de 8 GPU H200 Nvidia y su sistema de refrigeración.
“Este sistema de refrigeración no genera consumo hídrico debido a la disponibilidad de energía barata y abundante en Arica. Dada la composición de la matriz energética de Arica (99% de ERNC entre solar e hídrica), las emisiones de CO2 asociadas al entrenamiento son de 0,96 toneladas”, apuntan desde el organismo.
El Cenia destaca que la abundancia de energía solar en el norte de Chile “permite opciones de enfriamiento sin agua más eficientes y amigables con el medio ambiente”.
Si el calculo del Cenia es correcto, el entrenamiento del modelo requerirá menor esfuerzo que los grandes modelos de OpenAI o Google. De todas formas, esto son estimaciones que solo se podrán confirmar luego de que el modelo se entrene.
Latam-GPT representa un esfuerzo significativo para que América Latina tenga una voz propia en el desarrollo de la inteligencia artificial. Si bien persisten desafíos y consideraciones, el proyecto busca poner la tecnología al servicio de las personas y construir soluciones adaptadas al contexto regional.
Alibaba presenta modelo que entiende emociones. En la carrera por la IA los gigantes tecnológicos avanzas a terrenos más complejos.
Alibaba lanzó un innovador modelo de inteligencia artificial, R1-Omni, que promete revolucionar la forma en que las máquinas interactúan con los humanos. Este modelo, capaz de “leer” emociones, se presenta como un competidor directo del último modelo de OpenAI.
En dos demostraciones, investigadores del laboratorio Tongyi de Alibaba mostraron cómo R1-Omni puede inferir el estado emocional de una persona en un video, al tiempo que describe su ropa y entorno. Este avance representa una mejora significativa sobre el modelo HumanOmni, creado por el mismo equipo.
El lanzamiento de R1-Omni se produce en un contexto de creciente competencia en el campo de la IA. Alibaba, tras el sorprendente debut de DeepSeek en enero, está acelerando el desarrollo y lanzamiento de nuevas herramientas y aplicaciones de IA en diversos ámbitos.
La compañía ha comparado su modelo Qwen con DeepSeek, ha establecido una alianza con Apple Inc. para la IA en iPhones y ahora se enfrenta a OpenAI. Además, ofrece la descarga gratuita de R1-Omni en Hugging Face, democratizando el acceso a esta tecnología.
Inteligencia emocional: un paso clave
La capacidad de reconocer y responder a las emociones humanas, conocida como inteligencia emocional, es un área de creciente interés en la IA. Esta tecnología tiene aplicaciones en diversos campos, desde la atención al cliente hasta la seguridad en la conducción.
Si bien R1-Omni solo muestra descripciones emocionales generales, su capacidad para inferir emociones a partir de señales visuales es un avance significativo.
Mientras OpenAI cobra US$200 al mes por su modelo GPT-4.5, Alibaba ofrece R1-Omni de forma gratuita, en línea con su estrategia de guerra de precios en China. El CEO de Alibaba, Eddie Wu, ha declarado que la inteligencia artificial general es el principal objetivo de la compañía, y la inteligencia emocional es un paso fundamental hacia esa meta.
La seguridad y la privacidad están a la cabeza en las preocupaciones de los internautas en su uso de la red. Desde luego, no es una cuestión cualquiera. En la actualidad, compartimos y almacenamos todo tipo de datos privados en internet. Datos que se refieren a nuestra intimidad, preferencias, contactos y, por supuesto, información financiera. Tanto el robo de estos datos como la suplantación de identidad son riesgos a los que nos exponemos continuamente.
La aparición de una de las herramientas más revolucionarias de los últimos tiempos, la inteligencia artificial, ha representado un hito en la sociedad actual; no sólo por las funciones y posibilidades innovadoras que nos aporta, sino también por su capacidad para potenciar algunas áreas del mundo digital. Entre ellas, todo lo referido a la seguridad.
La IA puede analizar grandes cantidades de información (Big Data) y aprender (Machine Learning); además, su potencial para automatizar tareas es una perfecta primera línea de defensa frente a posibles ataques. No son pocas las empresas, de diversos sectores, que la están aprovechando para reducir sus vulnerabilidades. Uno de los mercados más paradigmáticos, a este respecto, es el de los casinos online.
La inteligencia artificial y los portales de casino
El casino online, tanto por su naturaleza digital como por el tipo de información que gestiona, tiene la capacidad de sacar partido de la IA para reforzar su seguridad y evitar que la privacidad de sus clientes se vea comprometida. Por otra parte, el prestigio de cada uno de estos portales depende directamente de su potencial para garantizar una experiencia segura y satisfactoria de sus clientes. Veamos algunas aplicaciones prácticas de esta tecnología en este ámbito concreto.
Uno de los elementos más importantes para asegurar la equidad y la transparencia en el caso de los tragamonedas es el RNG (Random Number Generator), un algoritmo que asegura que los premios son absolutamente aleatorios. La seguridad de esta herramienta es vital para el buen funcionamiento de un casino. Con la inteligencia artificial, puede dotarse de más barreras para evitar su ya de por sí compleja manipulación. Y no sólo eso, además, la IA puede evaluar si han existido intentos de vulnerar el algoritmo y si éste ha sido afectado de alguna forma.
Otro aspecto que ha evolucionado considerablemente gracias a esta tecnología es la capacidad de detectar patrones de comportamiento sospechosos en los usuarios. Por ejemplo, la forma de realizar transacciones o retiros, que podrían estar relacionaos con el fraude. O la utilización de datos que no corresponden a la información de las amplias bases de datos que la IA puede analizar, lo que podría tener relación con la suplantación de identidad.
Pero, aunque la IA no tenga la posibilidad de detectar o anticiparse a todas estas conductas, también puede mejorar la forma de afrontarlas cuando han ocurrido. Losnuevos servicios de atención al cliente de los casinos online, que utilizan este recurso, pueden priorizar casos en los que la seguridad haya sido vulnerada, dando una respuesta mucho más rápida y eficiente, evitando nuevos casos en el futuro y cuantificando los daños producidos, para compensar a los afectados.
De nuevo, si las defensas iniciales fallasen, esta herramienta podría ayudar a que los ataques tuvieran un impacto mucho más reducido. ¿Cómo? Por ejemplo, mediante una avanzada encriptación de los datos sensibles, de forma que su robo no fuese útil a los delincuentes. Su capacidad para evolucionar y adaptarse complicaría la posibilidad de que dicha información fuese accesible una vez sustraída.
Este es el caso únicamente de los casinos online. En aquellos que son presenciales, además, puede actuar en los accesos físicos, la mejora delos equipos de videovigilancia, la comunicación entre los responsables de seguridad y un largo etcétera. Pero, como es lógico, la modalidad en línea, por sus propias características, es capaz de aprovechar al máximo todas las ventajas que la tecnología ofrece con la mayor eficiencia.