Trabajando con Data Mining 4
2 Trabajando con Data Mining
2.1 Creando un Proyecto de Analysis Services
Usted debe crear un nuevo proyecto de Analysis Services para utilizar los algoritmos de Minera de Datos de SQL Server 2005, para ello utilice Microsoft Visual Studio y haga un nuevo proyecto desde el men Archivo, en tipos de proyecto seleccione Business Intelligence Projects y escoja la plantilla Analysis Services Project, tal y como se muestra en la Figura 1.
Figure 1: New Analysis Services Project.
En la Figura 2 se muestra el "Solution Explorer" con el nuevo Proyecto de Analysis Services.
Gua de Usuario
Figure 2: Analysis Services Project - Solution Explorer.
Existen 3 objetos bsicos para aplicar modelos de Minera en SQL Server 2005: Data Sources: Con este objeto, se crea la conexin hacia nuestra fuente de datos en SQL Server 2005. Data Source Views: Permite seleccionar cuales sern las tablas de datos para el modelo de Minera a partir del Data Source creado previamente. Mining Structures: Una vez creado el Data Source View se procede a utilizar un Wizard (Asistente) para aplicar un modelo de Minera a los datos de las tablas. Nota: Es importante recalcar que un proyecto de Analysis Services puede tener configurados mltiples objetos Data Source, Data Source View y Mining Structures.
Trabajando con Data Mining 6
2.1.1 Definiendo un Data Source
El primer paso para aplicar un modelo de minera es definir la conexin hacia la Base de Datos de Microsoft SQL Server donde se tienen los datos, para ello d clic derecho en el objeto Data Sources del Proyecto de Analysis Services, el cual se muestra en la Figura 3.
Figure 3: Data Sources.
D clic en la opcin New Data Source... para crear una nueva conexin, tal como se muestra en la Figura 4.
Figure 4: Create a New Data Source.
Paso 1: En la Figura 5 se muestra un asistente que le orienta paso a paso en el proceso que define la conexin hacia la Base de Datos. D clic en el botn Next para continuar.
Gua de Usuario
Figure 5: Data Source Wizard.
Paso 2: Definir la conexin a los datos, por defecto el asistente no selecciona la opcin crear un nuevo Data Source, para ello d clic en el botn New, este proceso lo llevar al siguiente paso, tal como se muestra en la Figura 6.
Trabajando con Data Mining 8
Figure 6: How to define the connection.
Paso 3: Usar el Connection Manager para seleccionar el Servidor y Base de Datos a usar en el modelo de Minera. Se usa un Provider como protocolo para establecer la conexin hacia la Base de Datos, por defecto se usa Native OLE DB\SQL Native Client,en la Figura 7 se muestra la lista de Provider's disponibles:
Gua de Usuario
Figure 7: Provider List.
Paso 4: La opcin Server name se utiliza para escribir o seleccionar el servidor de Base de Datos, las credenciales para la conexin pueden ser con una cuenta de usuario administrador de Windows o con autenticacin de un usuario en Microsoft SQL Server. La opcin Database name es el nombre de la base de datos de donde se van a tomar las tablas para aplicarles un modelo de Minera. La Figura 8, muestra como se cambian estas opciones.
Trabajando con Data Mining 10
Figure 8: Database selection.
Paso 5: Se selecciona la base de datos de la lista y luego d clic en el botn para probar la conexin, si es efectiva se muestra un mensaje de confirmacin en pantalla, que se ilustra en la Figura 9, luego se da clic en el botn OK para terminar la prueba de conexin y continuar.
Figure 9: Test connection.
Paso 6: Despus de probar la conexin, se da clic en el botn Ok para establecer los parmetros de conexin. La Figura 10 muestra el nuevo paso se en el asistente.
11
Gua de Usuario
Figure 10: Data Source Connection.
Paso 7: En Data Connection properties se detallan los parmetros para la conexin. D clic en para ir al nuevo paso del asistente donde se establecen las polticas para conectarse a la Base de Datos. La primera opcin especifica un usuario y password para la Base de Datos, la segunda permite conectarse al SQL Server con el service account, la siguiente utiliza las credenciales del usuario de Windows y Default utiliza las credenciales especificadas en las propiedades del Data Source. La Figura 11 muestra la seleccin de la mejor opcin para impersonalizacin.
Trabajando con Data Mining 12
Figure 11: Impersonation Information.
Paso 8: Seleccione la opcin y d clic en el botn para ir al ltimo paso del asistente donde usted puede personalizar el nombre del Data Source como se muestra en la Figura 12. D clic en para terminar de guardar los parmetros de conexin.
13
Gua de Usuario
Figure 12: Data Source Name.
Al finalizar se tiene el objeto Data Source con la conexin hacia la Base de Datos, tal como se muestra en la Figura 13.
Figure 13: Data Source.
Nota: consulte la siguiente direccin http://msdn.microsoft.com/es-cr/library/ms188949(en-us).aspx para obtener una especificacin de las propiedades del objeto Data Source.
Trabajando con Data Mining 14
2.1.2 Definiendo un Data Source View
Una vez que se define el Data Source, se seleccionan las tablas con los datos a los que se les va a aplicar el modelo de Minera con el objeto Data Source View. D clic en el folder Data Source Views, como se muestra en la Figura 14.
Figure 14: Data Source Views.
Se debe dar clic derecho en Data Source Views para crear un nuevo Data Source View. Siga los pasos del asistente para configurar un nuevo Data Source View, tal como se muestra en la Figura 15.
Figure 15: Create a New Data Source View.
Paso 1: La Figura 16 muestra el inicio del Asistente para crear un nuevo Data Source View desde tablas y vistas en una Base de Datos Relacional. D clic en el botn Next para continuar.
15
Gua de Usuario
Figure 16: Data Source View Wizard.
Paso 2: Seleccionar la fuente de datos (Data Source) donde estn las tablas o las vistas que se quieren usar. Se selecciona el Data Source previamente creado que apunta hacia la Base de Datos Master y que tiene las tablas que se quieren usar en el modelo de Minera tal como se muestra en la Figura 17. D clic en el botn Next para continuar.
Trabajando con Data Mining 16
Figure 17: Select a Data Source.
Paso 3: El asistente permite buscar relaciones lgicas entre las tablas, para el caso del ejemplo no se necesitan este tipo de relaciones, desmarque la opcin tal como se muestra en la Figura 18 y d clic en el botn Next para continuar.
17
Gua de Usuario
Figure 18: Logical relationships.
Paso 4: La Figura 19 muestra el proceso para seleccionar las tablas que van a estar disponibles en el Data Source View para ser usadas en el mtodo de Minera. Use el botn seleccionada o el botn al Data Source View. para agregar la tabla
para agregar todo el conjunto de tablas disponibles en el Data Source
Trabajando con Data Mining 18
Figure 19: Avalaible Tables for Data Source View.
Paso 5: Despus de seleccionar las tablas que sern cargadas en el Data Source View, tal como se muestra en la Figura 20, d clic en el botn Next.
19
Gua de Usuario
Figure 20: Included Tables.
Paso 6: La Figura 21 muestra como cambiar el nombre al Data Source View y finalizar el Asistente.
Trabajando con Data Mining 20
Figure 21: Data Source View Name.
El "Solution Explorer" del Proyecto de Analysis Services debe contener la lista de objetos creados hasta el momento, tal como se ilustra en la Figura 22.
Figure 22: Data Source View.
21
Gua de Usuario
2.2 Agregando Mining Structures al Proyecto
Para generar modelos de Minera de datos en Microsoft SQL Server 2005 Analysis Services (SSAS), se debe crear una estructura de Minera de datos, utilizando el Asistente en Business Intelligence Development Studio. La estructura de Minera de datos define el dominio de los datos desde el que se generan los modelos de Minera de datos. Las estructuras de Minera de datos se pueden basar en orgenes de datos relacionales o de procesamiento analtico en lnea (OLAP). Las estructuras de Minera de datos relacionales describen los datos que estn almacenados en sistemas de bases de datos relacionales. Las estructuras de Minera de datos OLAP se generan utilizando un cubo OLAP que existe en la misma base de datos que la estructura de Minera de datos. Nota: en http://msdn.microsoft.com/es-cr/library/ms174757.aspx sobre Mining Structures en Microsoft SQL Server 2005. se puede encontrar ms informacin
2.2.1 Creando una nueva Mining Structure
Para crear una nueva Mining Structure seleccione el objeto Mining Structures del Proyecto de Analysis Services tal como se muestra en la Figura 23.
Figure 23: Mining Structure - Solution Explorer.
D clic derecho en Mining Structures para definir una nueva Mining Structure tal como muestra la Figura 24. Se deben seguir los pasos del asistente para configurar la nueva Mining Structure.
Figure 24: New Mining Structure.
Iniciar el Asistente para crear una nueva Mining Structure y un nuevo Modelo de Minera para aplicar en tablas y vistas en una Base de Datos Relacional. D clic en el botn Siguiente para continuar. Tal como se muestra en la Figura 25.
Trabajando con Data Mining 22
Figure 25: Mining Structure Wizard.
Seleccionar una tcnica de data mining para usar en la nueva Mining Structure, tal como se muestra en la Figura 26. Microsoft SQL Server Analysis Services incluye los siguientes tipos de algoritmos: Algoritmos de Clasificacin Algoritmos de Regresin Algoritmos de Segmentacin Algoritmos de Asociacin Algoritmos de Anlisis de Secuencia
Nota: consulte http://msdn.microsoft.com/es-cr/library/ms175595(en-us).aspx para obtener informacin detallada sobre los tipos de algoritmos que provee Analysis Services y sobre como escoger el tipo correcto de algoritmo a usar.
23
Gua de Usuario
Figure 26: Select the Data Mining Technique.
Analysis Services se instala con una serie implementaciones de algoritmos de data mining, la lista de tcnicas de Minera de datos default se observa en la Figura 27:
Trabajando con Data Mining 24
Figure 27: Microsoft Data Mining Technique List.