Onde encontrar Datasets gratuitos para praticar análise de dados no Excel
Neste artigo mostramos cinco fontes gratuitas que permitem descarregar datasets para aplicar praticar soluções de análise e visualização de dados.
Resumo
Quando estamos a tentar aprender fórmulas ou novas formas de tratar dados é fundamental consolidar este conhecimento com a aplicação prática. Mas nem sempre temos acesso a dados reais. Por isso apresentamos neste artigo algumas soluções (gratuitas) de datasets com dados reais que permitem praticar de forma mais efectiva a aplicação destes novos conhecimentos.PORDATA - Estatísticas sobre Portugal e a Europa
A PORDATA, Base de Dados de Portugal Contemporâneo, disponibiliza dados estatísticos de fontes oficiais e certificadas sobre Portugal e a Europa.
Disponível em: PORDATA
Kaggle
O Kaggle é provavelmente o melhor ponto de partida para iniciar a aprendizagem de análise e tratamento de dados. O Kaggle é uma plataforma para competições de Data Science que foi fundada em 2010 por Anthony Goldbloom e adquirida em 2017 pela Google (Alphabet). Os datasets Titanic - Machine Learning from Disaster e House Prices - Advanced Regression Techniques são dois dos mais famosos datasets para iniciantes.
Disponível em: Kaggle Competitions
KDnuggets
O KDnuggets é um site dedicado a Data Science, Machine Learning, AI e Analytics que, além de ser uma excelente fonte de informação sobre este tema, disponibiliza um directório de várias fontes com datasets para praticar Data Mining e Data Science. O "KD" significa "Knowledge Discovery" (Descoberta de Conhecimento).
Disponível em: Datasets for Data Science, Machine Learning, AI & Analytics
UCI Machine Learning Repository
Este repositório, criado em 1987 na UC Irvine por David Aha, tem mais de 600 datasets disponibilizados gratuitamente sobre vários temas. Um dos datasets mais famosos que podes encontrar no UCI é o Iris Data Set.
Disponível em: University of Carolina - Irvine: Machine Learning Repository
Data.gov - Datasets dos E.U.A.
Open data do Governo Norte Americano. São mais de 300 mil datasets sobre vários temas relacionados com os Estados Unidos.
Disponível em: Data.gov
Data.World - Datasets
O data.world é uma comunidade colaborativa de data. Disponibiliza actualmente mais de 130.000 datasets.
Disponível em: Data.World - Datasets