Skip to main content

Introducción

En esta publicación de blog, presentamos cómo crear modelos de OpenAI dentro de MindsDB. En este ejemplo, le pedimos a un modelo que proporcione un resumen de un texto. Los datos de entrada se toman de nuestra base de datos MySQL de muestra.

Requisitos previos

Para seguir este tutorial, puedes registrarte para obtener una cuenta en cloud.mindsdb.com. Alternativamente, dirígete a la documentación de MindsDB y sigue las instrucciones para configurar manualmente una instancia local de MindsDB a través de Docker o pip.

Tutorial

En este tutorial, creamos un modelo predictivo para resumir un artículo. Utilizamos una tabla de nuestra base de datos de demostración pública de MySQL, así que comencemos conectando MindsDB a ella:
CREATE DATABASE mysql_demo_db
WITH ENGINE = 'mysql',
PARAMETERS = {
    "user": "user",
    "password": "MindsDBUser123!",
    "host": "db-demo-data.cwoyhfn6bzs0.us-east-1.rds.amazonaws.com",
    "port": "3306",
    "database": "public"
};
Ahora que hemos conectado nuestra base de datos a MindsDB, consultemos los datos que se utilizarán en el ejemplo:
SELECT *
FROM mysql_demo_db.articles
LIMIT 3;
Aquí está la salida:
+----------------------------------------------------------------+--------------------------------------------------------------+
| article                                                        | highlights                                                   |
+----------------------------------------------------------------+--------------------------------------------------------------+
| Video footage has emerged of a law enforcement officer…        | The 53-second video features…                                |
| A new restaurant is offering a five-course drink-paired menu…  | The Curious Canine Kitchen is…                               |
| Mother-of-two Anna Tilley survived after spending four days…   | Experts have warned hospitals not using standard treatment…  |
+----------------------------------------------------------------+--------------------------------------------------------------+
Creemos una tabla de modelo para resumir todos los artículos del conjunto de datos de entrada:
Antes de crear un modelo de OpenAI, por favor crea un motor, proporcionando tu clave API de OpenAI:
CREATE ML_ENGINE openai_engine
FROM openai
USING
	api_key = 'your-openai-api-key';
CREATE MODEL text_summarization_model
PREDICT highlights
USING
    engine = 'openai_engine',              
    prompt_template = 'provide an informative summary of the text text:{{article}} using full sentences';
En la práctica, la CREATE MODEL declaración hace que MindsDB genere una tabla de IA llamada text_summarization_model que utiliza la integración de OpenAI para predecir una columna llamada highlights. El modelo vive dentro del proyecto mindsdb por defecto. En MindsDB, los proyectos son una forma natural de mantener separados los artefactos, como modelos o vistas, según la tarea predictiva que resuelven. Puedes aprender más sobre los proyectos de MindsDB aquí. La cláusula USING especifica los parámetros que requiere este manejador.
  • El parámetro engine define que usamos el motor openai.
  • El parámetro prompt_template transmite la estructura de un mensaje que se completará con texto adicional generado por el modelo.
Sigue esta instrucción para configurar la integración de OpenAI en MindsDB.
Una vez que la declaración CREATE MODEL ha comenzado a ejecutarse, podemos verificar el estado del proceso de creación con la siguiente consulta:
DESCRIBE text_summarization_model;
Puede tardar un tiempo en registrarse como completo dependiendo de la conexión a internet. Una vez que la creación esté completa, el comportamiento es el mismo que con cualquier otra tabla de IA: puedes consultarla ya sea especificando datos sintéticos en la consulta real:
SELECT article, highlights
FROM text_summarization_model
WHERE article = "Apple's Watch hits stores this Friday when customers and employees
                alike will be able to pre-order the timepiece. And boss Tim Cook is
                rewarding his staff by offering them a 50 per cent discount on the device.";
Aquí están los datos de salida:
+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+------------------------------------------------------------------------------------+
| article                                                                                                                                                                                                            | highlights                                                                         |
+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+------------------------------------------------------------------------------------+
| Apple's Watch hits stores this Friday when customers and employees alike will be able to pre-order the timepiece. And boss Tim Cook is rewarding his staff by offering them a 50 per cent discount on the device.  | Apple's Watch hits stores this Friday, and employees will be able to pre-order the |
+--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------+------------------------------------------------------------------------------------+
O uniéndola con otra tabla para predicciones por lotes:
SELECT input.article, output.highlights
FROM mysql_demo_db.articles AS input
JOIN text_summarization_model AS output
LIMIT 3;
Aquí están los datos de salida:
+----------------------------------------------------------------+------------------------------------------------------------------------------------------------+
| article                                                        | highlights                                                                                     |
+----------------------------------------------------------------+------------------------------------------------------------------------------------------------+
| Video footage has emerged of a law enforcement officer…        | A video has emerged of a law enforcement officer grabbing a cell phone from a woman who was    |
| A new restaurant is offering a five-course drink-paired menu…  | A new restaurant in London is offering a five-course drink-paired menu for dogs                |
| Mother-of-two Anna Tilley survived after spending four days…   | Sepsis is a potentially life-threatening condition that occurs when the body's response to an  |
+----------------------------------------------------------------+------------------------------------------------------------------------------------------------+
La tabla articles se utiliza para hacer predicciones por lotes. Al unir el modelo text_summarization_model con la tabla articles, el modelo utiliza todos los valores de la columna article.

Aprovecha las capacidades de NLP con MindsDB

Al integrar bases de datos y OpenAI usando MindsDB, los desarrolladores pueden extraer fácilmente información de datos de texto con solo unos pocos comandos SQL. Estos potentes modelos de procesamiento de lenguaje natural (NLP) son capaces de responder preguntas con o sin contexto y completar indicaciones generales. Además, estos modelos están impulsados por grandes modelos de lenguaje pre-entrenados de OpenAI, por lo que no hay necesidad de trabajo de desarrollo manual. En última instancia, esto proporciona a los desarrolladores una forma fácil de incorporar potentes capacidades de NLP en sus aplicaciones mientras ahorran tiempo y recursos en comparación con los métodos y pipelines de desarrollo de ML tradicionales. En resumen, ¡MindsDB hace posible que los desarrolladores aprovechen el poder de OpenAI de manera eficiente! MindsDB es ahora la plataforma de aprendizaje automático aplicado de código abierto de más rápido crecimiento en el mundo. Su comunidad continúa contribuyendo a más de 70 integraciones de fuentes de datos y marcos de ML. ¡Mantente atento a las próximas características, incluyendo más control sobre los parámetros de interfaz y el ajuste fino de modelos directamente desde MindsDB! Experimenta con modelos de OpenAI dentro de MindsDB y desbloquea la capacidad de ML sobre tus datos en minutos. Recuerda registrarte para obtener una cuenta de demostración gratuita y seguir los tutoriales, quizás esta vez usando tus propios datos. Finalmente, si la visión de MindsDB de democratizar el ML te parece emocionante, dirígete a nuestro Slack de la comunidad, donde puedes obtener ayuda y encontrar personas para charlar sobre el uso de otras fuentes de datos disponibles, marcos de ML, o escribir un manejador para traer los tuyos propios! Sigue nuestra introducción a la integración de OpenAI de MindsDB aquí. Además, tenemos una variedad de tutoriales que utilizan MySQL y MongoDB:

¿Qué sigue?

¡Diviértete mientras lo pruebas tú mismo! Si este tutorial te fue útil, por favor danos una estrella en GitHub aquí.