Les nouveaux services Amazon Personalize et Textract

- Date: 11 July, 2019
AWS continue de se développer sur l'apprentissage automatique en annonçant la disponibilité d'Amazon Personalize, un service offrant des techniques de personnalisation basées sur l'IA, ainsi que Textract, qui extrait automatiquement le texte et les données des tableaux et des formulaires. Un autre développement important est le lancement d'Amazon MSK, pour aider les développeurs à créer et à exécuter des applications sécurisées et évolutives basées sur Apache Kafka.
Amazon Personalize
Examinons-les de plus près, en commençant par Amazon Personalize, un service entièrement géré qui apporte les techniques de personnalisation basées sur l'IA d'Amazon.com aux clients AWS, même sans expertise préalable en apprentissage automatique.
Le nouveau service forme, ajuste et déploie des modèles d'apprentissage automatique personnalisés et privés. Il fournit également l'infrastructure nécessaire et gère l'ensemble du pipeline d'apprentissage automatique, y compris le traitement des données, l'identification des fonctionnalités, la sélection des algorithmes, ainsi que la formation, l'optimisation et l'hébergement des résultats. Les clients reçoivent les résultats via une interface de programmation d'application (API) et ne paient que ce qu'ils utilisent, sans frais minimum ni engagement initial.
Le service peut aider à développer des applications pour un large éventail de cas d'utilisation de personnalisation, y compris des recommandations de produits spécifiques et des résultats de recherche individualisés. Par exemple, Yamaha, qui vend une gamme d'instruments de musique et de produits audio, l'utilise déjà pour proposer à ses clients des suggestions de produits personnalisées.
Textract
L'apprentissage automatique est également au centre de Textract, un nouveau service déjà disponible qui extrait automatiquement du texte et des données à partir de tableaux ou de formulaires dans pratiquement n'importe quel document. Encore une fois, aucune expérience en machine learning n'est requise.
De nombreuses entreprises utilisent un logiciel de reconnaissance optique de caractères (OCR) pour extraire du texte et des données à partir de fichiers. Cependant, les technologies OCR traditionnelles ont souvent du mal à reconnaître les mises en page courantes telles que les formulaires et les tableaux, ce qui entraîne des vidages de texte longs et souvent inexacts.
L'API de Textract prend en charge plusieurs formats d'image, notamment les numérisations, les PDF et les photos. Les clients peuvent ensuite charger les données résultantes dans des logiciels d'entreprise, tels que des feuilles de calcul, des bases de données et des systèmes de paie, ou ils peuvent analyser et interroger les données à l'aide d'Amazon ElasticSearch, Amazon DynamoDB, Amazon Redshift ou Amazon Athena.
Les exemples d'utilisation incluent l'identification de texte et de données tels que les éléments de ligne et les totaux d'un reçu photographié, ou les valeurs d'un tableau dans un rapport d'inventaire numérisé. Il est également capable de reconnaître une gamme de formats de documents, y compris ceux spécifiques aux services financiers, à l'assurance et à la santé, sans nécessiter de personnalisation ni d'intervention humaine.
Amazon MSK
Le nouveau Amazon Managed Streaming for Apache Kafka (Amazon MSK) fournit un service de streaming de données hautement sécurisé et compatible pour Apache Kafka.
L'objectif est d'aider les entreprises qui cherchent à utiliser la plate-forme de streaming distribué open source populaire pour éviter le temps et les dépenses de configuration, de mise à l'échelle et de gestion des clusters Apache Kafka pour capturer et analyser des flux de données en temps réel à partir d'une gamme de sources, y compris les appareils IoT. , les flux de clics sur le site Web, les systèmes financiers et les journaux de base de données.
Le nouveau service permet aux développeurs de créer et d'exécuter facilement des applications basées sur Apache Kafka sans avoir à se soucier de la gestion de l'infrastructure sous-jacente. Il est entièrement compatible avec Apache Kafka, ce qui signifie que les clients peuvent facilement migrer leurs clusters sur site ou Amazon Elastic Cloud Compute (Amazon EC2) vers Amazon MSK sans modification de code. Il fonctionne également avec plusieurs autres offres de cloud AWS, telles que la fourniture de métriques dans Amazon CloudWatch. La prise en charge devrait bientôt être ajoutée pour AWS CloudFormation afin d'aider à décrire et à provisionner les ressources d'infrastructure dans un environnement cloud.
Rajesh Sheth, directeur général d'Amazon MSK, a expliqué la raison d'être de la nouvelle offre : "Les clients qui utilisent Apache Kafka nous ont dit qu'ils souhaitaient passer moins de temps à gérer l'infrastructure et plus de temps à créer des applications basées sur des données de streaming en temps réel".
« Amazon MSK donne à ces clients la possibilité d'exécuter Apache Kafka sans avoir à se soucier de la gestion du matériel sous-jacent, et il leur offre un moyen simple d'intégrer leurs applications Apache Kafka à d'autres services AWS. Avec Amazon MSK, les clients peuvent mettre en place des clusters Apache Kafka en quelques minutes au lieu de plusieurs semaines, afin qu'ils puissent passer plus de temps à se concentrer sur les applications qui ont un impact sur leurs activités.