Machine Learning en AWS: cómo potenciarlo

- Fecha: 11 April, 2020
AWS continúa desarrollando Machine Learning anunciando Amazon Personalize, un servicio que ofrece técnicas de personalización impulsadas por la IA, junto con Textract, que extrae automáticamente texto y datos de tablas y formularios.
Otro avance significativo es el lanzamiento del MSK de Amazon, para ayudar a los desarrolladores a crear y ejecutar aplicaciones altamente disponibles, seguras y escalables basadas en Apache Kafka.
Analicémoslas más a fondo, empezando por Amazon Personalize, un servicio totalmente gestionado que pone a disposición de los clientes de AWS las técnicas de personalización basadas en la IA de Amazon.com, incluso sin experiencia previa en el Machine Learning.
El nuevo servicio entrena, sintoniza y despliega modelos de Machine Learning privados y personalizados. También proporciona la infraestructura necesaria y gestiona todo el proceso de Machine Learning, incluyendo el procesamiento de datos, la identificación de características, la selección de algoritmos, así como la formación, la optimización y el alojamiento de los resultados. Los clientes reciben los resultados a través de una Interfaz de Programación de Aplicaciones (API) y sólo pagan por lo que utilizan, sin cuotas mínimas ni compromisos iniciales.
El servicio puede ayudar en el desarrollo de aplicaciones para una amplia gama de casos de uso de personalización, incluyendo recomendaciones específicas de productos y resultados de búsqueda individualizados.
Machine Learning es también el principal objetivo de Textract, un nuevo servicio ya disponible que extrae automáticamente texto y datos de tablas o formularios en prácticamente cualquier documento. Una vez más, no se requiere ninguna experiencia de Machine Learning.
Muchas empresas utilizan software de reconocimiento óptico de caracteres (OCR) para extraer texto y datos de los archivos. Sin embargo las tecnologías tradicionales de OCR a menudo tienen dificultades para reconocer diseños comunes como formularios y tablas, lo que da lugar a largos y a menudo inexactos volcados de texto.
La API de Textract admite múltiples formatos de imagen, incluidos escaneos, PDF y fotografías. Los clientes pueden entonces cargar los datos resultantes en software empresarial, como hojas de cálculo, bases de datos y sistemas de nóminas, o pueden analizar y consultar los datos utilizando Amazon ElasticSearch, Amazon DynamoDB, Amazon Redshift o Amazon Athena.
Entre los ejemplos de utilización figuran el texto y los datos de identificación, como las partidas y los totales de un recibo fotografiado, o los valores de una tabla en un informe de inventario escaneado. También es capaz de reconocer una gama de formatos de documentos, incluyendo los específicos de los servicios financieros, seguros y sanidad, sin necesidad de personalización o intervención humana.
Amazon MSK
Enuevo Amazon Managed Streaming para Apache Kafka (Amazon MSK) proporciona un servicio de transmisión de datos altamente disponible, seguro y compatible para Apache Kafka.
El objetivo es ayudar a las empresas que desean utilizar la popular plataforma de transmisión distribuida de código abierto a evitar el tiempo y los gastos de establecimiento, ampliación y gestión de las agrupaciones de Apache Kafka para capturar y analizar corrientes de datos en tiempo real de diversas fuentes, entre ellas dispositivos de IO, corrientes de clics en sitios web, sistemas financieros y registros de bases de datos.
El nuevo servicio facilita a los desarrolladores la construcción y ejecución de aplicaciones basadas en Apache Kafka sin tener que preocuparse por la gestión de la infraestructura subyacente. Es totalmente compatible con Apache Kafka, lo que significa que los clientes pueden migrar fácilmente sus clústeres de computación en nube elástica de Amazon (Amazon EC2) a Amazon MSK sin cambios de código.
También funciona con varias otras ofertas de nubes de AWS, como la provisión de métricas en Amazon CloudWatch. Pronto se añadirá apoyo a AWS CloudFormation para ayudar a describir y proveer recursos de infraestructura en un entorno de nubes.
Rajesh Sheth, Director General de Amazon MSK explicó la razón de ser de la nueva oferta, diciendo: "Los clientes que están ejecutando Apache Kafka nos han dicho que quieren dedicar menos tiempo a la gestión de la infraestructura y más tiempo a la creación de aplicaciones basadas en datos de transmisión en tiempo real".
"Amazon MSK ofrece a estos clientes la posibilidad de ejecutar Apache Kafka sin tener que preocuparse por la gestión del hardware subyacente, y les proporciona una forma fácil de integrar sus aplicaciones Apache Kafka con otros servicios de AWS. Con Amazon MSK, los clientes pueden hacer funcionar los clusters de Apache Kafka en minutos en lugar de semanas, por lo que pueden pasar más tiempo centrándose en las aplicaciones que afectan a sus negocios".