PDF - VERSÃO DE IMPRESSÃO

Lição 17 - Aprendizado de Máquina: Algoritmos e Modelos

objetivo

Olá, estudante! Depois de estudarmos os fundamentos do aprendizado de máquina na lição anterior, agora, avançaremos para o estudo dos algoritmos e modelos desse mesmo campo. Dessa forma, esta lição tem como objetivo oferecer a você, futuro Técnico em Desenvolvimento de Sistemas, uma compreensão clara e aplicada dos conceitos de algoritmos e modelos no contexto do aprendizado de máquina. Por meio de uma abordagem gradual e acessível, você entenderá como os algoritmos são usados para extrair padrões a partir de dados e como, a partir desse processo, são gerados modelos capazes de realizar previsões e classificações de forma autônoma.

A lição também abordará os tipos mais comuns de algoritmos empregados em tarefas supervisionadas e não supervisionadas, incluindo a lógica de funcionamento e os critérios que orientam a escolha do algoritmo mais adequado para diferentes problemas. Ao final do percurso, você, estudante, será capaz de diferenciar algoritmos e modelos, compreender o respectivo papel em projetos de Machine Learning e aplicar esse conhecimento na construção de soluções inteligentes, alinhadas às demandas atuais da ciência de dados.

Vamos lá?

problematização

No cotidiano de quem atua com ciência de dados, uma das grandes problemáticas enfrentadas é lidar com a enorme quantidade de informações geradas por usuários, sistemas e dispositivos, sem conseguir transformá-las em decisões automatizadas, personalizadas e eficientes. Frequentemente, desenvolvedores se deparam com a necessidade de construir soluções capazes de responder dinamicamente a contextos variados, tais como recomendar produtos, prever falhas em sistemas, detectar comportamentos anômalos ou classificar automaticamente informações com base em características complexas.

Nesses cenários, algoritmos e modelos de aprendizado de máquina surgem como alternativas eficazes, pois permitem que os sistemas “aprendam” a partir de exemplos passados e ajustem o próprio comportamento com base nos padrões identificados nos dados. Essa abordagem transforma a lógica tradicional de programação, baseada em regras fixas, em uma lógica adaptativa e inteligente.

Assim, o uso de modelos preditivos contribui para solucionar o desafio de criar sistemas mais autônomos e eficientes, agregando valor aos produtos desenvolvidos, otimizando processos e aprimorando de forma significativa a experiência do usuário.

Vamos entender melhor como isso funciona na prática?

case

Agora, conhecendo melhor a importância do tema estudado nesta lição, vamos entender como os algoritmos e os modelos de aprendizado de máquina funcionam na prática? Para isso, conheça a empresa fictícia LogiFleet, especializada em soluções tecnológicas para gestão de frotas e logística, que enfrentava um desafio recorrente: otimizar as entregas em grandes centros urbanos, onde o trânsito imprevisível, as condições climáticas e os imprevistos operacionais comprometiam os prazos e aumentavam os custos.

Diante desse cenário, a equipe de desenvolvimento decidiu incorporar algoritmos e modelos de aprendizado de máquina no software de roteirização, transformando dados históricos em inteligência preditiva. Utilizando informações de entregas anteriores, como horários, tempo de trajeto, localização dos clientes, características das cargas e dados de trânsito em tempo real, os desenvolvedores criaram um modelo supervisionado capaz de sugerir as melhores rotas com base em previsões de congestionamento e tempo estimado de entrega.

Como resultado, a empresa reduziu em 18% o tempo médio das entregas e em 12% os custos operacionais, além de melhorar significativamente a satisfação dos clientes. Esse projeto marcou uma virada no posicionamento da empresa, que passou a ser reconhecida por oferecer uma solução de logística inteligente e adaptativa, pautada em dados e aprendizado contínuo. Esse é apenas um dos exemplos que demonstram como algoritmos e modelos de aprendizado de máquina podem transformar processos, otimizar recursos e gerar vantagens competitivas em diferentes setores.

Ao longo desta lição, entenderemos melhor como essas ferramentas são aplicadas, reforçando a importância de compreender sua lógica e funcionamento para a construção de soluções eficientes e inovadoras. Vamos lá?

Conceitualização

Assim como foi estudado na lição anterior, o aprendizado de máquina (Machine Learning) é uma área da Inteligência Artificial (IA) que permite que sistemas “aprendam” a partir de dados, sem serem explicitamente programados para cada situação. Neo (2024) o descreve como uma subárea da Inteligência Artificial motivada pelo desenvolvimento de softwares mais independentes da intervenção humana para a extração do conhecimento, algo que representava uma dificuldade nos Sistemas Especialistas.

As principais funções são identificar padrões, realizar previsões e tomar decisões com base em grandes volumes de informação. Esse campo está diretamente relacionado à Inteligência Artificial por representar uma de suas formas mais aplicáveis e eficientes no cotidiano, integrando-se à ciência de dados no processo de extração de conhecimento e valor a partir dos dados.

Para você, futuro Técnico em Desenvolvimento de Sistemas, compreender como os algoritmos e os modelos de aprendizado de máquina operam é essencial para criar soluções inteligentes que automatizam tarefas, melhoram a experiência do usuário e apoiam decisões estratégicas. Ao dominar essas ferramentas, você será capaz de integrar modelos preditivos em sistemas reais, contribuindo para que empresas e organizações atuem de forma mais eficiente e orientada por dados.

Modelos

Modelos de aprendizado de máquina são um resultado do processo de treinamento de algoritmos com conjuntos de dados, especialmente no contexto do aprendizado supervisionado. Um modelo representa matematicamente os padrões aprendidos a partir dos dados rotulados, sendo capaz de generalizar esse conhecimento para realizar previsões ou classificações sobre novos dados.

Por exemplo, ao treinar um modelo com informações sobre hábitos de consumo, ele pode prever preferências de compra futuras de um cliente. Para você, futuro Técnico em Desenvolvimento de Sistemas, compreender o funcionamento dos modelos é essencial, pois é por meio deles que os algoritmos ganham capacidade preditiva e se tornam ferramentas aplicáveis a soluções reais. Portanto, dominar a maneira como os modelos são construídos, avaliados e ajustados é um passo crucial para implementar sistemas inteligentes e eficientes no cotidiano profissional.

Principais algoritmos de aprendizado supervisionado

Os algoritmos de aprendizado supervisionado têm ampla aplicação na construção de modelos preditivos e classificadores. Cada um deles utiliza uma lógica diferente para aprender com os dados e realizar previsões. A seguir, será apresentada uma breve explicação conceitual dos algoritmos mais comuns, acompanhada de uma implementação prática simplificada em Python, utilizando a biblioteca scikit-learn.

Se você se recorda, na Lição 9 já apresentamos o K-Nearest Neighbors (KNN) e o Naive Bayes.

Regressão Linear

A regressão linear é utilizada para prever um valor contínuo com base em uma ou mais variáveis independentes. Neo (2024) a descreve como uma das ferramentas estatísticas empregadas para compreender e modelar as relações entre variáveis. Esse algoritmo assume uma relação linear entre os dados de entrada e a saída. Observe uma implementação desse algoritmo na Figura 1 a seguir:

Figura 1 - Regressão Linear em Python
Fonte: o autor.

#PraCegoVer: é mostrado o seguinte código: na linha 1, from sklearn.linear_model import LinearRegression; na linha 2, from sklearn.model_selection import train_test_split; na linha 3, from sklearn.metrics import mean_squared_error; na linha 4, import pandas as pd; na linha 6, dados = pd.DataFrame({; na linha 7, 'horas_estudo': [1, 2, 3, 4, 5]; na linha 8, 'nota': [2, 4, 5, 4, 5]; na linha 9, }); na linha 11, X = dados[['horas_estudo']]; na linha 12, y = dados['nota']; na linha 14, X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2); na linha 16, modelo = LinearRegression(); na linha 17, modelo.fit(X_train, y_train); na linha 18, predicoes = modelo.predict(X_test); na linha 20, print("Erro quadrático médio:", mean_squared_error(y_test, predicoes)).

Esse código implementa uma regressão linear simples utilizando a biblioteca scikit-learn, com o objetivo de prever a nota de um estudante com base na quantidade de horas de estudo. Primeiro, é criado um conjunto de dados fictício contendo pares de valores que representam horas de estudo e respectivas notas. Em seguida, os dados são divididos em variáveis de entrada (X) e saída (y), e separados em conjuntos de treino e teste, sendo 20% dos dados reservados para teste. O modelo de regressão linear é, então, instanciado e treinado com os dados de treino por meio do método .fit(). Após o treinamento, o modelo realiza previsões com os dados de teste, e o desempenho é avaliado pelo erro quadrático médio (MSE), uma métrica que indica o quão distantes as previsões estão dos valores reais: quanto menor o erro, melhor o desempenho do modelo.

Árvore de Decisão

As árvores de decisão dividem os dados com base em regras condicionais, criando uma estrutura em forma de árvore, na qual cada nó representa uma decisão com base em um atributo. Mint (2024) explica que elas podem ser utilizadas tanto para classificação quanto para regressão (previsão numérica) de dados. Observe a implementação desse algoritmo na Figura 2 a seguir:

Figura 2 - Árvore de decisão em Python
Fonte: o autor.

#PraCegoVer: é exibido o seguinte código: na linha 1, from sklearn.tree import DecisionTreeClassifier; na linha 2, from sklearn.datasets import load_iris; na linha 3, from sklearn.model_selection import train_test_split; na linha 4, from sklearn.metrics import accuracy_score; na linha 6, iris = load_iris(); na linha 7, X, y = iris.data, iris.target; na linha 9, X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2); na linha 11, modelo = DecisionTreeClassifier(); na linha 12, modelo.fit(X_train, y_train); na linha 13, predicoes = modelo.predict(X_test); na linha 15, print("Acurácia:", accuracy_score(y_test, predicoes)).

Esse código constrói e avalia um modelo de classificação utilizando a técnica de Árvore de Decisão, aplicado ao famoso conjunto de dados Iris. Primeiramente, os dados são carregados com a função load_iris(), que contém informações sobre diferentes espécies de flores com base em características, como comprimento e largura das pétalas e sépalas. As variáveis X e y representam, respectivamente, os dados de entrada (atributos das flores) e os rótulos (espécies). Em seguida, o conjunto é dividido em dados de treino e teste, com 80% destinados ao treino, e 20% ao teste. O modelo é criado e treinado com os dados de treino usando o método .fit(). Após o treinamento, ele realiza previsões com o conjunto de teste por meio do método .predict(). Por fim, a acurácia, isto é, a proporção de classificações corretas, é calculada e exibida utilizando a função accuracy_score(). Sendo assim, esse processo permite verificar o quão bem o modelo aprendeu a classificar corretamente as espécies de flores.

Compreender algoritmos e modelos de aprendizado de máquina é fundamental para transformar dados em conhecimento útil e aplicável. Enquanto os algoritmos definem a lógica de aprendizado a partir dos dados, os modelos representam o resultado concreto desse processo, sendo capazes de realizar previsões e classificações com base em padrões previamente identificados. Juntos, formam a base para a construção de sistemas inteligentes que se adaptam a diferentes contextos e desafios. Para você, futuro Técnico em Desenvolvimento de Sistemas, dominar esses conceitos significa estar apto a implementar soluções inovadoras, otimizando processos e auxiliando na tomada de decisões com maior precisão, autonomia e eficiência. Essa compreensão é o ponto de partida para explorar, com responsabilidade e criatividade, o potencial transformador do aprendizado de máquina no cotidiano profissional!

saiba aplicar

Para você, futuro Técnico em Desenvolvimento de Sistemas, compreender algoritmos e modelos de aprendizado de máquina é essencial para atuar em um cenário cada vez mais orientado por dados e automação. Esse conhecimento permite interpretar como os sistemas inteligentes funcionam, além de projetar e implementar soluções que aprendem com os dados e se ajustam a diferentes contextos.

Ao dominar esses fundamentos, enquanto profissional, você será capaz de escolher e aplicar o algoritmo mais adequado para resolver problemas reais, transformando dados em decisões precisas, previsões confiáveis e aplicações mais eficientes. Ter esse domínio ampliará significativamente as suas possibilidades de atuação enquanto técnico, agregando valor ao seu trabalho e às soluções tecnológicas que desenvolve.

Agora que você compreendeu como esse conteúdo pode ser útil na sua rotina profissional, chegou a sua vez! Nesta prática, você aplicará os conceitos de algoritmos e modelos de aprendizado de máquina por meio da criação de um modelo de regressão linear simples, com o objetivo de prever o valor de um imóvel com base em sua metragem quadrada, utilizando um pequeno conjunto de dados fictícios. Essa atividade ajudará a consolidar o seu entendimento sobre como os algoritmos aprendem com os dados e geram modelos capazes de realizar previsões. Para isso, siga os passos a seguir:

Passo 1: certifique-se de ter o Python instalado com as bibliotecas pandas, scikit-learn e matplotlib. Caso seja necessário, instale usando: pip install pandas scikit-learn matplotlib
Passo 2: crie o conjunto de dados usando o pandas, momento em que você construirá um DataFrame simples com duas colunas: metragem (em metros quadrados) e preço do imóvel, conforme Figura 3 a seguir:

Figura 3 - Conjunto de dados fictícios
Fonte: o autor.

#PraCegoVer: é exibido o seguinte código: na linha 1, import pandas as pd; na linha 3, dados = pd.DataFrame({; na linha 4, 'metragem': [50, 60, 70, 80, 90]; na linha 5, 'preco': [200000, 240000, 280000, 320000, 360000]; na linha 6, }).

Passo 3: separe os dados de entrada e saída, definindo as variáveis independentes (x) e a variável dependente (y), que será o valor a ser previsto, conforme a Figura 4 a seguir:

Figura 4 - Separação dos dados de entrada e saída
Fonte: o autor.

#PraCegoVer: é exibido o seguinte código: na linha 1, X = dados[['metragem']]; na linha 2, y = dados['preco'].

Passo 4: divida os dados em treino e teste usando train_test_split para separar os dados em conjuntos de treinamento e teste (80% e 20%), conforme Figura 5 a seguir:

Figura 5 - Divisão dos dados em treino e teste
Fonte: o autor.

#PraCegoVer: é exibido o seguinte código: na linha 1, from sklearn.model_selection import train_test_split; na linha 3, X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42).

Passo 5: treine o modelo de Regressão Linear utilizando o algoritmo de regressão linear para treinar um modelo de dados de treino, conforme a Figura 6 a seguir:

Figura 6 - Treinamento do modelo
Fonte: o autor.

#PraCegoVer: é exposto o seguinte código: na linha 1, from sklearn.linear_model import LinearRegression; na linha 3, modelo = LinearRegression(); na linha 4, modelo.fit(X_train, y_train).

Passo 6: faça previsões com o modelo treinado usando os dados de teste para avaliar o desempenho do modelo conforme a linha a seguir: y_pred = modelo.predict(X_test)
Passo 7: avalie a performance do modelo calculando o erro quadrático médio para verificar a precisão da previsão, conforme a Figura 7 a seguir:

Figura 7 - Avaliação do modelo
Fonte: o autor.

#PraCegoVer: é exposto o seguinte código: na linha 1, from sklearn.metrics import mean_squared_error; na linha 3, erro = mean_squared_error(y_test, y_pred); na linha 4, print("Erro quadrático médio:", erro).

Passo 8: visualize os resultados usando o Matplotlib para exibir os dados e a linha de regressão, conforme a Figura 8 a seguir:

Figura 8 - Visualização dos resultados
Fonte: o autor.

#PraCegoVer: é exibido o seguinte código: na linha 1, import matplotlib.pyplot as plt; na linha 3, plt.scatter(X, y, color='blue', label='Dados reais'); na linha 4, plt.plot(X, modelo.predict(X), color='red', label='Linha de regressão'); na linha 5, plt.xlabel('Metragem (m²)'); na linha 6, plt.ylabel('Preço do imóvel'); na linha 7, plt.title('Regressão Linear Simples'); na linha 8, plt.legend(); na linha 9, plt.show(). Na linha 2 não há conteúdo escrito.

Inicialmente, um pequeno conjunto de dados é criado utilizando a biblioteca pandas, contendo as colunas metragem e preço. Em seguida, os dados são divididos em variáveis de entrada (X) e saída (y) e, posteriormente, separados em conjuntos de treino e teste utilizando train_test_split, reservando 20% dos dados para teste. Com a biblioteca scikit-learn, o modelo de regressão linear é instanciado, treinado com os dados de treino por meio do método .fit() e utilizado para prever os preços com base nos dados de teste.

O desempenho do modelo é avaliado por meio do erro quadrático médio (MSE), que indica o quão próximas as previsões estão dos valores reais. Por fim, utilizando matplotlib, os dados reais são exibidos em um gráfico de dispersão, e a linha de regressão gerada pelo modelo é sobreposta, permitindo visualizar a relação linear entre a metragem e o preço do imóvel.

Assim, essa prática ilustra de forma acessível como algoritmos e modelos de aprendizado de máquina podem ser aplicados na construção de soluções preditivas. Com esses passos, você constrói um modelo preditivo simples que pode ser adaptado para diferentes variáveis e contextos reais. Essa experiência mostra como algoritmos e modelos de aprendizado de máquina podem ser aplicados em situações do cotidiano para gerar informações valiosas e apoiar decisões.

REFERÊNCIAS

MINT, D. Árvore de decisão: aprenda rapidamente a Inteligência Artificial. [S. l.: s. n.], 2024.

NEO, G. Regressão Linear em aprendizagem de máquina. [S. l.: s. n.], 2024.

Page updated

Google Sites

Report abuse