Del curso: Microsoft Azure IA esencial: Introducción a Workloads y Machine Learning en Azure

Demostración de Azure Machine Learning

Cuando desplegamos el servicio de Azure Machine Learning en el portal de Azure, se va a crear un área de trabajo con el nombre que hayamos especificado, y aquí podemos encontrar todas las piezas y componentes necesarios para los proyectos de machine learning. Aquí, por ejemplo, ya estoy en esta área de trabajo llamada azure-ia-esencial-ml y en la parte de la izquierda vamos a encontrar un menú con una gran cantidad de opciones y esto va a depender de qué queramos hacer en esta área de trabajo. Generalmente, lo primero que queremos hacer es subir los datos con los que queremos trabajar o conectar el servicio de Azure Machine Learning a una fuente de datos en la nube. Esto lo podemos hacer acá en la parte de Data y después podemos hacer clic aquí en el botón de Create. Por ejemplo, yo ya tengo un archivo llamado pets.csv, que es un archivo separado por comas que tiene información ficticia de mascotas y su factibilidad de enfermarse o estar enfermas. Entonces, aquí le podemos poner un nombre, vamos a ponerle pets, le voy a poner pets2 porque esto ya lo hice con anticipación. Aquí voy a seleccionar Tabular; nota que hay diferentes tipos, pero en este caso, es un formato tabular. Después, como podrás ver aquí en pantalla, puedes conectarte a diferentes fuentes de datos, como por ejemplo, bases de datos de tipo SQL o almacenamiento en Azure o archivos que tengas de forma locales, etc. En este caso, justamente esa es la opción que voy a seleccionar y aquí en esta parte me va a preguntar dónde quiero almacenar el archivo que voy a subir y en esta opción voy a seleccionar justamente el archivo que ya tengo por acá llamado pets.csv. Esto lo analiza y me dice que ya está listo para ser subido. En esta otra página que tenemos aquí, podemos observar estos datos que provienen del archivo separado por comas. Además, en la parte de arriba tenemos algunos controles para filtrar estos datos si así fuese necesario. Bien, después voy a hacer clic en el botón Siguiente, ya que aquí puedo tener mucho más control sobre los datos que tiene esta fuente. En este caso, voy a aceptar absolutamente todo y finalmente haría clic en el botón Create para que se subiera este archivo. Toma en cuenta que esto ya lo hice con anticipación, aquí está, llamado pets. Podemos hacer clic en esta fuente de datos y en la parte de Explore podemos ver toda esta información que nos da el archivo separado por comas. Muy bien, entonces ese sería uno de los primeros pasos que podemos hacer aquí en el área de trabajo. Otra cosa que podemos hacer, claro, con conocimientos suficientes en el lenguaje de programación de nuestra preferencia para analizar datos, en este caso, Python, podemos crear un notebook de tipo Jupyter Notebooks para poder explorar y analizar todos estos datos utilizando el lenguaje de programación. El primer camino que puedes usar es crear un nuevo archivo. Para eso, usarías esta opción que está aquí en pantalla, pero en mi caso, yo ya tengo un archivo en mi disco duro que voy a subir, que es justamente este Jupyter Notebook, y aquí voy a subirlo. Nota que tiene todo este código que lo que está haciendo es justamente leer la fuente de datos, que es pets, es decir, el archivo separado por comas que te acabo de mostrar, pero con algunas líneas de código en Python estoy graficando este promedio de la probabilidad de que algunas mascotas, específicamente el tipo de mascota, qué tan probable es que se enferme. Todo esto lo hice a través de estas líneas de código que están por acá y que, cabe mencionar, puedes seguir aquí editando el código, pero insisto, esto va a depender si tus necesidades para analizar los datos requieren conocimientos de este lenguaje de programación. Otra cosa que podemos hacer aquí en el área de trabajo es utilizar la opción de Automated ML, que nos ayuda de gran manera a crear experimentos con machine learning basándonos en los datos que hayamos subido, y es justamente lo que quiero mostrarte aquí. Voy a hacer clic en el botón de Nuevo, aquí lo que hace es cargar esta página donde puedo ponerle un nombre a este job o trabajo que se va a hacer. En este caso, se va a crear un nuevo experimento; vamos a ponerle mi_experimento, de forma opcional, una descripción y algunas etiquetas. Después me pregunta cuáles son los datos que quiero utilizar. En este caso, recuerda que ya tenemos pets, por eso aquí aparece en pantalla. Lo que voy a hacer es seleccionar en la parte de arriba cuál es el tipo de tarea que quiero hacer. Puedes ver que me da la opción de Clasificación, Regresión, Línea de tiempo y algunas otras opciones más. En este caso, voy a seleccionar Clasificación y después clic en Siguiente. Aquí voy a seleccionar la columna destino, que en este caso sería disease_flag, que es la columna que tiene el valor para determinar qué tan probable la mascota es que se enferme. Aquí, de forma opcional, puedes habilitar esto de deep learning, cosa que no voy a hacer. Posteriormente, vamos a hacer clic en Siguiente, y este sería prácticamente el último paso, es decir, seleccionar el cómputo que quieres utilizar para ejecutar todo este experimento. En este caso, voy a seleccionar la opción de Serverless, pero también podrías seleccionar una opción de alguna instancia de cómputo que hayas predefinido aquí en el portal. Toma en cuenta que todo esto obviamente tiene un costo y por esa razón aquí en mi caso voy a seleccionar Serverless, me voy a regresar por acá y finalmente Serverless y posteriormente haría clic en el botón Siguiente y mandaría este trabajo de entrenamiento, cosa que ya hice con anticipación. Te voy a mostrar acá en la parte de Jobs cómo este experimento_1, de hecho, si hago clic, vemos que está ejecutando desde hace bastantes minutos, y es que esto va a depender del tipo de cómputo que hayas utilizado y obviamente de la dificultad o complejidad de este experimento. Aquí, obviamente, no me voy a esperar a que esto termine porque pueden pasar bastantes minutos antes de que este trabajo finalice. Por último, en este video, también te quiero mostrar el Diseñador que tenemos por acá. Este diseñador es bastante útil, ya que nos permite tener esta experiencia visual para conectar los diferentes componentes y diferentes tareas que queramos tener en algún proyecto de machine learning. Por ejemplo, en esta parte de Data, en esta pestaña, pues detecta que aquí está pets, recuerda que eso lo subí con anticipación, simplemente arrastrando y soltando elementos, los puedes aquí conectar entre sí. Por ejemplo, en la parte de Componentes vamos a buscar Select y lo que voy a hacer es seleccionar este componente, que, como puedes observar aquí, al tener el cursor del mouse encima del componente, me da una información mucho más detallada acerca de cómo funciona, simplemente lo voy a arrastrar y soltar y esto es tan fácil como ir conectando nodos entre sí. De esta manera, con este diseñador, puedes crear proyectos completos con machine learning de una forma visual y sencilla. Como resumen, Azure Machine Learning y este Azure Machine Learning Studio te dan todas las herramientas necesarias y componentes para crear los proyectos de machine learning que requiera tu organización.

Contenido