Você Acontece

Regressão Linear com Python

Gráfico de Dispersão

Hoje eu vou lhes mostrar conceitos básicos de regressão linear e fornecer um exemplo de código em Python usando a biblioteca scikit-learn para criar uma regressão linear simples.

Conceitos:

A regressão linear é um método estatístico que visa modelar a relação linear entre uma variável dependente (alvo) e uma ou mais variáveis independentes (características). É frequentemente expressa na forma de uma equação linear:


[y = mx + b]

Onde:

  • (y) é a variável dependente (alvo).
  • (x) é a variável independente (característica).
  • (m) é o coeficiente angular (inclinação) da linha.
  • (b) é o termo de interceptação (intercept).

O objetivo é encontrar os valores de (m) e (b) que melhor se ajustam aos dados, minimizando a soma dos quadrados dos erros (método dos mínimos quadrados).

Código em Python:

Aqui está um exemplo de como criar uma regressão linear simples em Python usando a biblioteca scikit-learn:

# Importar as bibliotecas necessárias
import numpy as np
from sklearn.linear_model import LinearRegression
import matplotlib.pyplot as plt

# Dados de exemplo
X = np.array([1, 2, 3, 4, 5]).reshape(-1, 1)  # Variável independente
y = np.array([2, 4, 5, 4, 5])  # Variável dependente

# Criar um objeto de regressão linear
regression = LinearRegression()

# Treinar o modelo com os dados
regression.fit(X, y)

# Fazer previsões
y_pred = regression.predict(X)

# Coeficientes da regressão
coef_angular = regression.coef_[0]
intercept = regression.intercept_

# Plotar os dados e a linha de regressão
plt.scatter(X, y, label='Dados reais')
plt.plot(X, y_pred, color='red', label='Regressão Linear')
plt.xlabel('Variável Independente')
plt.ylabel('Variável Dependente')
plt.legend()
plt.show()

print(f"Coeficiente Angular (Inclinação): {coef_angular}")
print(f"Interceptação: {intercept}")

Este código cria uma regressão linear simples, ajusta-a aos dados e traça a linha de regressão. Os coeficientes angular (inclinação) e de interceptação são impressos no final. É importante lembrar que a regressão linear simples é um caso básico; em aplicações do mundo real, você pode lidar com múltiplas variáveis independentes e modelos mais complexos.

Entendendo o poder do python como neste poste: Pandas: A Poderosa Ferramenta para Análise de Dados em Python, voccê já sabe o que esperar da série de posts sequenciais e estruturados em um esquema lógico de aprendizagem que será exibido aqui na categoria Tecnologia do Você Acontece. Nunca foi tão fácil aprender ciência de dados da forma como será apresentada a você.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *