Hoje eu vou lhes mostrar conceitos básicos de regressão linear e fornecer um exemplo de código em Python usando a biblioteca scikit-learn
para criar uma regressão linear simples.
Conceitos:
A regressão linear é um método estatístico que visa modelar a relação linear entre uma variável dependente (alvo) e uma ou mais variáveis independentes (características). É frequentemente expressa na forma de uma equação linear:
[y = mx + b]
Onde:
- (y) é a variável dependente (alvo).
- (x) é a variável independente (característica).
- (m) é o coeficiente angular (inclinação) da linha.
- (b) é o termo de interceptação (intercept).
O objetivo é encontrar os valores de (m) e (b) que melhor se ajustam aos dados, minimizando a soma dos quadrados dos erros (método dos mínimos quadrados).
Código em Python:
Aqui está um exemplo de como criar uma regressão linear simples em Python usando a biblioteca scikit-learn
:
# Importar as bibliotecas necessárias
import numpy as np
from sklearn.linear_model import LinearRegression
import matplotlib.pyplot as plt
# Dados de exemplo
X = np.array([1, 2, 3, 4, 5]).reshape(-1, 1) # Variável independente
y = np.array([2, 4, 5, 4, 5]) # Variável dependente
# Criar um objeto de regressão linear
regression = LinearRegression()
# Treinar o modelo com os dados
regression.fit(X, y)
# Fazer previsões
y_pred = regression.predict(X)
# Coeficientes da regressão
coef_angular = regression.coef_[0]
intercept = regression.intercept_
# Plotar os dados e a linha de regressão
plt.scatter(X, y, label='Dados reais')
plt.plot(X, y_pred, color='red', label='Regressão Linear')
plt.xlabel('Variável Independente')
plt.ylabel('Variável Dependente')
plt.legend()
plt.show()
print(f"Coeficiente Angular (Inclinação): {coef_angular}")
print(f"Interceptação: {intercept}")
Este código cria uma regressão linear simples, ajusta-a aos dados e traça a linha de regressão. Os coeficientes angular (inclinação) e de interceptação são impressos no final. É importante lembrar que a regressão linear simples é um caso básico; em aplicações do mundo real, você pode lidar com múltiplas variáveis independentes e modelos mais complexos.
Entendendo o poder do python como neste poste: Pandas: A Poderosa Ferramenta para Análise de Dados em Python, voccê já sabe o que esperar da série de posts sequenciais e estruturados em um esquema lógico de aprendizagem que será exibido aqui na categoria Tecnologia do Você Acontece. Nunca foi tão fácil aprender ciência de dados da forma como será apresentada a você.