¿Qué es una cámara con IA y cómo funciona la edición de fotos con IA?

Tabla de contenido:

Anonim

La inteligencia artificial (IA) está en todas partes, y si aún no tiene un teléfono inteligente con inteligencia artificial, probablemente pronto lo tendrá. Incluso el software de su teléfono utiliza inteligencia artificial para tomar decisiones en su nombre. La cámara Photoshop de Adobe, recién lanzada, utiliza inteligencia artificial para identificar objetos y escenas en sus imágenes y sugerir 'lentes' (efectos digitales) para un impacto cómico y creativo.

¿Es todo solo arrogancia de marketing, o es la inteligencia artificial en un teléfono inteligente, y particularmente, en su cámara, algo a lo que todos deberíamos aspirar? Dado que el término AI se usa cada vez más no solo en teléfonos con cámara, sino en todo tipo de cámaras, vale la pena saber qué está haciendo realmente la AI por sus fotos.

La IA ha difuminado los límites entre la captura de imágenes, la mejora de imágenes y la manipulación de imágenes. Se utiliza en la edición de fotografías, para fusionar, mejorar y 'aumentar' la realidad, para hacer selecciones de objetos más inteligentes, para hacer coincidir los parámetros de procesamiento con el sujeto y para ayudarlo a encontrar las imágenes automáticamente en función de lo que hay en sus fotos en lugar de palabras clave manuales. y descripciones. Ya está mirando lo que fotografías y tomando sus propias decisiones sobre cómo manejarlo.

Bienvenido al nuevo y valiente mundo de las cámaras con IA.

¿Qué es la IA?

La IA es un género de ciencias de la computación que examina si podemos enseñarle a una computadora a pensar o, al menos, a aprender. Por lo general, se divide en subconjuntos de tecnología que intentan emular lo que hacen los humanos, como el reconocimiento de voz, el dictado de voz a texto, el reconocimiento de imágenes y el escaneo facial, la visión por computadora y el aprendizaje automático.

Hay una gran cantidad de palabras de moda en torno a este tema. 'IA', 'aprendizaje profundo', 'aprendizaje automático' y 'redes neutrales' están todos entrelazados en esta nueva rama de la tecnología.

¿Qué tiene que ver con las cámaras? Fotografía computacional y edición de fotos que ahorra tiempo, eso es. Y activación por voz.

Cámaras activadas por voz

La capacidad de una computadora para comprender el habla humana es una forma de inteligencia artificial, y se ha estado infiltrando en las cámaras durante los últimos años.

Los teléfonos inteligentes han estado ofreciendo Google Now y Siri durante algunos años, mientras que Alexa ingresa a los hogares a través de los parlantes Amazon Echo. Las cámaras de acción se han subido a ese tren en los últimos años, con las cámaras de acción GoPro e incluso las cámaras de tablero capaces de realizar acciones cuando pronuncias frases simples como "iniciar video", "tomar una foto", etc.

Todo tiene sentido, especialmente para las cámaras de acción donde el funcionamiento con manos libres las hace mucho más fáciles de usar, pero ¿es realmente IA? Técnicamente, lo es, pero hasta hace poco, los dispositivos activados por voz se denominaban simplemente "inteligentes". Algunos ahora te permiten decir cosas bastante específicas como "tomar video en cámara lenta" o "tomar una foto con poca luz", pero una cámara con IA necesita hacer un poco más que eso para merecer ese nombre.

Software de inteligencia artificial

La IA se trata de nuevos tipos de software, inicialmente para compensar la falta de lentes de zoom de los teléfonos inteligentes. "El software se está volviendo cada vez más importante para los teléfonos inteligentes porque carecen de óptica física, por lo que hemos visto el aumento de la fotografía computacional que intenta replicar un zoom óptico", dice el analista de imágenes Arun Gill, analista senior de mercado en Futuresource Consulting . "Los teléfonos inteligentes de gama alta cuentan cada vez más con cámaras de doble lente, pero Google Pixel 3 usa una sola lente de cámara con fotografía computacional para replicar un zoom óptico y agregar varios efectos".

Desde el Pixel 3, las matrices de varias cámaras y las imágenes computacionales se han fusionado para producir una tecnología híbrida que reproduce muchos de los efectos de profundidad de campo y lentes que se obtienen con las cámaras más grandes. Un teléfono con cámara ya no es 'solo' una cámara. Es un dispositivo de cálculo, análisis y 'pensamiento' que no solo captura la escena tal como es, sino cómo cree que quiere que sea, o cómo cree que debería querer que sea …

La IA puede ser como tener un asistente sabelotodo. Después de un tiempo, es posible que empiece a preguntarse quién está realmente a cargo.

El mundo no está necesariamente preparado para todas las implicaciones de las cámaras de IA. Google usó inteligencia artificial en su cámara portátil Google Clips, que usó inteligencia artificial para capturar y guardar solo momentos particularmente memorables. Usó un algoritmo que entendía los conceptos básicos de la fotografía, por lo que no perdió tiempo procesando imágenes que definitivamente no harían el corte final de un carrete de reflejos. Por ejemplo, borró automáticamente las fotografías con un dedo en el encuadre y las imágenes desenfocadas, y favoreció las que cumplían con el concepto general de la regla de los tercios de cómo encuadrar una foto.

¿Espeluznante y controlador? Algunos pensaron que sí. En cualquier caso, Google retiró la cámara en 2022-2023. La pregunta no es si la IA es lo suficientemente poderosa para hacer las cosas que queremos, sino si estamos listos todavía para entregar tanta potencia a una máquina … oa la empresa que posee y opera los algoritmos de IA detrás de él.

¿Qué es la fotografía computacional?

La fotografía computacional es una técnica de procesamiento de imágenes digitales que utiliza algoritmos para reemplazar los procesos ópticos y busca mejorar la calidad de la imagen mediante el uso de visión artificial para identificar el contenido de una imagen.

“Se trata de tomar los efectos de estudio que se logran con Lightroom y Photoshop y hacerlos accesibles a las personas con solo hacer clic en un botón”, dice Simon Fitzpatrick, director senior de gestión de productos en FotoNation, que proporciona gran parte de la tecnología computacional a las marcas de cámaras.

"Así que puedes suavizar la piel y eliminar las imperfecciones, pero no solo difumándola, también obtienes textura". En el pasado, la tecnología detrás de los modos "piel suave" y "belleza" consistía esencialmente en difuminar la imagen para ocultar imperfecciones. "Ahora se trata de crear looks que sean creíbles, y la IA juega un papel clave en eso", dice Fitzpatrick. "Por ejemplo, usamos IA para entrenar algoritmos sobre las características de los rostros de las personas".

Desde el teléfono LG V30S ThinQ, LG ha estado usando IA para imágenes. Permite al usuario seleccionar una imagen profesional en su aplicación Graphy y aplicar el mismo balance de blancos, velocidad de obturación, apertura e ISO. LG también presentó Vision A, un motor de reconocimiento de imágenes que utiliza una red neuronal entrenada en 100 millones de imágenes, que recomienda cómo configurar la cámara. Incluso detecta reflejos en la imagen, el ángulo de disparo y la cantidad de luz disponible.

Sensores de profundidad y fondos borrosos

En los últimos años, hemos visto muchas cámaras de teléfonos con lentes múltiples que utilizan dos o más lentes para producir imágenes estéticamente agradables que tienen un fondo borroso alrededor del sujeto principal. A las personas (y, por lo tanto, a Instagram) les encantan los fondos borrosos, pero en lugar de usar cámaras de doble lente o tomar una DSLR y manipular manualmente la profundidad de campo, la IA ahora puede hacerlo por usted.

Comúnmente llamado efecto 'bokeh' (desenfoque en japonés), el aprendizaje automático identifica al sujeto y desenfoca el resto de la imagen. “Ahora podemos simular el bokeh usando algoritmos basados ​​en IA que segmentan a las personas desde el primer plano y el fondo, de modo que podemos crear un efecto que comienza a parecerse mucho a un retrato tomado en un estudio”, dice Fitzpatrick. Los últimos teléfonos inteligentes le permiten hacer esto para las fotos tomadas con la cámara trasera o frontal (selfie).

“La gente se refiere a él como bokeh, pero no obtienes el verdadero desenfoque que obtienes con una DSLR en la que puedes cambiar la profundidad; con un teléfono, solo se puede difuminar el fondo ”, dice Gill. "Pero un número pequeño y creciente de fotógrafos están realmente impresionados con él y están usando un iPhone X para la captura diaria, y solo cuando están en trabajos profesionales sacarán su DSLR".

Las cámaras AI pueden combinar automáticamente imágenes HDR con luz brillante, cambiar a un modo de captura de múltiples imágenes con poca luz y usar la magia de las imágenes computacionales para crear un efecto de zoom continuo con dos o más módulos de cámara.

¿Qué pasa con las DSLR y otras cámaras "adecuadas"?

La eliminación automática de ojos rojos ha estado en las cámaras DSLR durante años, al igual que la detección de rostros y, últimamente, incluso la detección de sonrisas, mediante la cual se toma una selfie automáticamente cuando el sujeto sonríe. Todo eso es IA. ¿Nikon y Canon adoptarán alguna vez una IA más avanzada para sus DSLR insignia? Después de todo, tomó muchos años para que WiFi y Bluetooth aparecieran en las DSLR.

Mientras esperamos, un accesorio de "asistente de cámara inteligente" financiado por Kickstarter llamado Arsenal quiere llenar el vacío. “Arsenal es un accesorio que permite el control inalámbrico de una cámara de lentes intercambiables (por ejemplo, una DSLR) desde un dispositivo móvil, con algoritmos de aprendizaje automático que se utilizan para tomar la foto perfecta”, dice Gill. "Lo que está haciendo es comparar la escena actual con miles de imágenes pasadas, usar el reconocimiento de imágenes para reconocer un sujeto específico y aplicar la configuración correcta, como una velocidad de obturación rápida si reconoce la vida silvestre".

Canon, mientras tanto, se ha apoyado en gran medida en la tecnología AI para el sistema de enfoque automático de vanguardia en la EOS-1D X Mark III. O, para ser más precisos, "aprendizaje profundo". La complejidad de los algoritmos es la misma (el sistema se entrena con fotografías profesionales) pero el aprendizaje profundo es el resultado final … la inteligencia artificial es la capacidad de una máquina para seguir aprendiendo por sí misma.

Sin embargo, puede ser difícil separar la verdadera IA de la automatización sofisticada. Durante años, los fabricantes de cámaras compactas han estado ofreciendo diferentes modos de escena orientados al sujeto que la cámara puede elegir automáticamente. ¿Es eso "inteligencia" o simplemente una implementación un poco más avanzada de la medición de la exposición, el movimiento del sujeto y la distancia de enfoque? Los sistemas de medición de múltiples patrones generalmente usan una medición compleja de la distribución de la luz basada en miles de fotos del mundo real y han estado usando un proceso de 'aprendizaje profundo' antes de que se inventara el término.

¿Para quién es la fotografía con IA?

Todos. Para empezar, se trata de democratizar la fotografía. "En el pasado, la fotografía era el dominio de quienes tenían la experiencia de usar una DSLR para crear diferentes tipos de imágenes, y lo que la IA ha comenzado a hacer es hacer que los efectos y las capacidades de la fotografía más avanzada estén disponibles para más personas", dice Fitzpatrick. .

Entonces, ¿esto significa que Photoshop y Lightroom de Adobe pronto desaparecerán? Absolutamente no; La IA es una tecnología complementaria y ya está haciendo que la edición de fotografías sea mucho más automatizada. Uno de los socios de FotoNation es Athen Tech, cuya tecnología basada en IA "Perfectly Clear" realiza correcciones automáticas por lotes que imitan el ojo humano. Un complemento para Lightroom, está específicamente destinado a reducir el tiempo que los fotógrafos se sientan frente a las computadoras editando manualmente. "Los fotógrafos profesionales ganan dinero cuando toman fotos, no cuando procesan imágenes", dice Fitzpatrick. "La IA hace que los efectos creativos de aspecto profesional sean más accesibles para los usuarios de teléfonos inteligentes y ayuda a los fotógrafos profesionales a maximizar su capacidad para ganarse la vida".

La IA se está convirtiendo rápidamente en un término usado en exceso en el mundo de la fotografía. En este momento, se aplica en gran medida a las cámaras de los teléfonos inteligentes, pero los increíbles algoritmos y el gran nivel de software automatizado que permite la tecnología pronto resultarán irresistibles para la mayoría de nosotros. Puede que aún no sea el momento de deshacerse de la DSLR, pero parece que la IA va a cambiar la forma en que tomamos las fotos.

No solo eso, sino que pronto podría encargarse de editar y curar nuestras bibliotecas de fotografías existentes también. Ese proceso ya ha comenzado. Lightroom CC utiliza el sistema de reconocimiento de objetos Sensei basado en servidor de Adobe para identificar imágenes por tema, de modo que ya no tenga que pasar horas agregando palabras clave manualmente. La IA puede ser un término exagerado y, a menudo, una abreviatura de lo que no es más que el último y mejor software avanzado, pero la IA promete hacer algo increíble para los fotógrafos; le permitirá disponer de más tiempo para que pueda tomar más y mejores fotografías.

¿Por qué algunos teléfonos tienen dos cámaras en un lado? Explicación de los diseños de cámara dual

Skylum Software es uno de los líderes en software de edición de fotos con tecnología de inteligencia artificial. Ha introducido AI Sky Replacement en Luminar para eliminar todo el enmascaramiento manual necesario para hacer esto manualmente, AI Augmented Skies para agregar nubes, planetas, rayos y más a sus imágenes, herramientas de mejora de retrato AI que pueden identificar de forma autónoma características humanas y AI Structure para agregar definición solo a aquellas áreas de una imagen donde sea apropiado.

El uso de la realidad aumentada en la fotografía aún podría resultar controvertido. Desde la invención de los editores de imágenes, ha sido posible distorsionar, torcer e 'inventar' la realidad, pero la IA promete hacer esto tan fácil y convincente que no requiere ninguna habilidad (o conciencia) particular para hacerlo.

• Los mejores teléfonos con cámara que puedes comprar hoy
• El mejor software de edición de fotos en este momento
• Cómo descargar Photoshop
• Cómo descargar Lightroom