Onde encontrar Datasets gratuitos para praticar análise de dados no Excel

Neste artigo mostramos cinco fontes gratuitas que permitem descarregar datasets para aplicar praticar soluções de análise e visualização de dados.
Onde encontrar Datasets gratuitos para praticar análise de dados no Excel

Resumo

Quando estamos a tentar aprender fórmulas ou novas formas de tratar dados é fundamental consolidar este conhecimento com a aplicação prática. Mas nem sempre temos acesso a dados reais. Por isso apresentamos neste artigo algumas soluções (gratuitas) de datasets com dados reais que permitem praticar de forma mais efectiva a aplicação destes novos conhecimentos.

PORDATA - Estatísticas sobre Portugal e a Europa

PORDATA - Estatísticas sobre Portugal e a Europa

A PORDATA, Base de Dados de Portugal Contemporâneo, disponibiliza dados estatísticos de fontes oficiais e certificadas sobre Portugal e a Europa.

Disponível em: PORDATA

Kaggle

Kaggle Competitions

O Kaggle é provavelmente o melhor ponto de partida para iniciar a aprendizagem de análise e tratamento de dados. O Kaggle é uma plataforma para competições de Data Science que foi fundada em 2010 por Anthony Goldbloom e adquirida em 2017 pela Google (Alphabet). Os datasets Titanic - Machine Learning from Disaster e House Prices - Advanced Regression Techniques são dois dos mais famosos datasets para iniciantes.

Disponível em: Kaggle Competitions

KDnuggets

KDnuggets datasets

O KDnuggets é um site dedicado a Data Science, Machine Learning, AI e Analytics que, além de ser uma excelente fonte de informação sobre este tema, disponibiliza um directório de várias fontes com datasets para praticar Data Mining e Data Science. O "KD" significa "Knowledge Discovery" (Descoberta de Conhecimento).

Disponível em: Datasets for Data Science, Machine Learning, AI & Analytics

UCI Machine Learning Repository

UCI Machine Learning Repository

Este repositório, criado em 1987 na UC Irvine por David Aha, tem mais de 600 datasets disponibilizados gratuitamente sobre vários temas. Um dos datasets mais famosos que podes encontrar no UCI é o Iris Data Set.

Disponível em: University of Carolina - Irvine: Machine Learning Repository

Data.gov - Datasets dos E.U.A.

Data.gov - US open data

Open data do Governo Norte Americano. São mais de 300 mil datasets sobre vários temas relacionados com os Estados Unidos.

Disponível em: Data.gov

Data.World - Datasets

Data.World - Datasets

O data.world é uma comunidade colaborativa de data. Disponibiliza actualmente mais de 130.000 datasets.

Disponível em: Data.World - Datasets