La pareja perfecta, combinar inteligencia artificial y visión artificial

Blog CMiBCN, Proyectos, Visión Artificial

19 Jul 2022 Carlos

La pareja perfecta, combinar inteligencia artificial y visión artificial

All Images Courtesy of Teledyne Industrial Vision Solutions.

La visión por computadora y la inteligencia artificial (IA) tienen cada una su propósito en los sistemas de visión modernos. Al desarrollar una plataforma de imágenes, pueden surgir ciertos desafíos al intentar implementar IA en un sistema de visión por computadora existente. Al principio, puede ser difícil decidir qué tareas son las más adecuadas para la IA. Por lo tanto, es beneficioso buscar la experiencia de los expertos de la industria que ya han dado muchos pasos para proporcionar una combinación de soluciones de inteligencia artificial y visión por computadora.

Valor de la IA

La experiencia en software de imagen tradicional ha estado disponible durante mucho tiempo. Mediante el uso de la visión por computadora, los ingenieros hemos podido abordar los desafíos en muchas aplicaciones industriales, incluida la automatización de la visión artificial, los sistemas de transporte inteligente (ITS) y las imágenes aéreas. Sin embargo, cuando las imágenes capturadas son complejas y variadas, como nuevas formas, orientaciones y colores, se sabe que la visión por computadora lucha donde la IA puede florecer.

Una aplicación ITS común es la detección de vehículos. Esto puede ser un desafío cuando se utiliza una solución de visión por computadora tradicional debido a las variables que existen en las imágenes al aire libre. En el método tradicional, un desarrollador puede programar especificaciones para que el software busque un cambio en la imagen para detectar un vehículo. Sin embargo, si el software activa una cámara cuando cambia la imagen, para indicar que un vehículo pasa junto a la cámara, varios otros cambios en la imagen podrían hacer lo mismo. Por ejemplo, si el clima cambia, el software puede interpretarlo como un cambio que requiere que la cámara capture una imagen. Además, si algo entra en el campo de visión, como un pájaro, esto también puede disparar la cámara.

Image Courtesy of Teledyne Industrial Vision Solutions.

En una fábrica donde el mismo tipo de objeto pasa continuamente por la cámara, el software de visión por computadora puede capturar con precisión imágenes de productos, componentes o materiales para su inspección. Por el contrario, en un escenario al aire libre, varios fenómenos pueden introducir inconsistencias en la escena y causar complicaciones al programar una solución. AI puede proporcionar valor en tal situación.

Entrenar software de IA, que es un algoritmo que identifica un tema específico, es bastante diferente de programar software de visión por computadora. El proceso de entrenamiento de un software de IA es menos rígido. Es similar a presentar un tema a un estudiante y pedirle que revise el material muchas veces hasta que lo entienda. Sin embargo, la IA debe enfocarse con un tema en particular en mente.

En lugar de entrenar el software de IA para que pueda reconocer todo lo que ve con la cámara e identificar vehículos, el entrenamiento se enfoca solo en vehículos. Al reconocer el aspecto de un automóvil, camión o motocicleta, un programa de IA sabrá buscar posibles objetivos dentro de una imagen. Con esta línea de base, el software de IA puede ignorar todos los demás problemas que puedan surgir en el entorno real de imágenes de tráfico.

Valor de la visión artificial

Si bien la IA puede proporcionar una nueva capacidad a un sistema de visión, no es la única opción. El software tradicional de visión por computadora puede ofrecer soluciones eficientes a varios desafíos de imagen. Donde la IA puede ser beneficiosa para el análisis de imágenes complejas, también tiene un inconveniente, la cantidad de tensión que ejerce sobre los recursos informáticos. Por otro lado, el software de visión por computadora ofrece programas simples que son fáciles de ejecutar en algunos de los sistemas integrados más pequeños.

Volviendo a las aplicaciones de tráfico, una forma en que pueden beneficiarse enormemente del software de visión por computadora es con el reconocimiento óptico de caracteres (OCR). En lugar de usar IA que podría requerir más recursos informáticos, un software OCR de visión por computadora simplemente verifica la imagen en busca de formas básicas para que coincida con una de una lista preestablecida de caracteres para placas de matrícula. Los caracteres de cada matrícula se pasan a través de un sistema OCR y se imprimen para la recopilación de datos de cada vehículo que captura el sistema de cámara. Esto puede ser ventajoso para registrar de manera efectiva cada matrícula escaneando cada carácter y guardando esos datos para la aplicación de peaje.

Cómo usarlas juntas

Un sistema de visión que utiliza IA más la visión artificial tradicional puede lograr un análisis de imágenes mucho más complicado.

Para ITS, tanto el OCR como la detección de vehículos son cruciales para la aplicación de peajes. Pero para garantizar que el software de visión por computadora pueda pasar de manera confiable a través de una muestra de imagen consistente, el sistema de imagen también necesitaría aislar cada vehículo en una imagen. En cualquier imagen, la cámara puede capturar varios vehículos y cada matrícula debe aislarse y detectarse por separado antes de que el software de visión por computadora las inspeccione.

Dado que cada vehículo puede tener una variedad de posiciones de matrícula y también pueden adoptar una variedad de colores, puede ser ventajoso tener una IA que se use para estos casos extremos. Una placa de una región en particular puede venir en varios colores porque, a medida que se emiten nuevas placas, pueden tener nuevos estilos que reemplacen los formatos antiguos. En la imagen, se muestran diferentes matrículas de varias regiones e incluso algunas de la misma región (Ontario) con diferentes diseños que podrían confundir a un sistema de visión que no esté bien capacitado para adaptarse a estas opciones.

Una vez que se detecta una placa, el resto de la imagen se puede recortar para que solo quede una placa rectangular de la que se puede usar el OCR para extraer los caracteres. Las tres placas de la Figura 6 muestran varias formas de suciedad o lodo que pueden ocultar una placa. Incluso las cubiertas de las matrículas pueden reducir el reflejo de la luz de los personajes y pueden representar un desafío adicional.

El ejemplo del mundo real

La implementación de IA en un sistema de visión existente puede ser un desafío. Existe un sistema de imágenes ITS para OCR que inicialmente se diseñó para ser un sistema de visión por computadora con el objetivo de lograr una alta precisión y luego se amplió para incorporar los beneficios de la IA.

La realidad de este sistema de detección de vehículos era que había demasiadas variables solo para la visión artificial. Se introdujo la IA para capturar las imágenes y la visión por computadora terminó proporcionando un análisis eficiente para OCR. El sistema resultante involucró mucho trabajo en el desarrollo y prueba de diferentes opciones.

Muchas personas pueden intentar configurar los sistemas de la manera tradicional y simplemente usar la visión por computadora. Sin embargo, la IA permite que los sistemas detecten fácilmente objetivos en imágenes complejas, mientras que la visión por computadora puede funcionar rápidamente a través del análisis de imágenes repetibles. Los expertos en imágenes han demostrado que tanto la IA como la visión por computadora son herramientas importantes en los sistemas de imágenes modernos y trabajan con integradores de sistemas para proporcionar elementos de sistemas de visión que combinan lo mejor de ambos mundos.

Fuente: www.qualitymag.com

La pareja perfecta, combinar inteligencia artificial y visión artificial

La pareja perfecta, combinar inteligencia artificial y visión artificial

Valor de la IA

Valor de la visión artificial

Cómo usarlas juntas

El ejemplo del mundo real

Deja una respuesta Cancelar la respuesta