Ini Adalah Sumber Data Terbuka Gratis Terbaik yang Dapat Digunakan Siapapun

Apa itu Open Data?

Secara sederhana, Open Data berarti jenis data yang terbuka untuk siapa saja dan semua orang untuk diakses, dimodifikasi, digunakan kembali, dan dibagikan.

Open Data mendapatkan basisnya dari berbagai “gerakan terbuka” seperti open source, perangkat keras terbuka, pemerintahan terbuka, sains terbuka, dll.

Pemerintah, organisasi independen, dan lembaga telah maju untuk membuka pintu air data untuk membuat lebih banyak data terbuka untuk akses gratis dan mudah.

Mengapa Open Data Penting?

Data terbuka penting karena dunia semakin berkembang berdasarkan data. Namun jika ada pembatasan akses dan penggunaan data, gagasan bisnis dan tata kelola berbasis data tidak akan terwujud.

Oleh karena itu, open data memiliki keunikan tersendiri. Ini dapat memungkinkan pemahaman yang lebih penuh tentang masalah global dan masalah universal. Ini dapat memberikan dorongan besar bagi bisnis. Ini bisa menjadi pendorong yang bagus untuk pembelajaran mesin. Ini dapat membantu memerangi masalah global seperti penyakit atau kejahatan atau kelaparan. Data terbuka dapat memberdayakan warga negara dan karenanya dapat memperkuat demokrasi. Ini dapat merampingkan proses dan sistem yang telah dibangun oleh masyarakat dan pemerintah. Ini dapat membantu mengubah cara kita memahami dan terlibat dengan dunia.

Jadi, inilah daftar 15 sumber Data Terbuka saya yang mengagumkan:

1. Data Terbuka Bank Dunia

Sebagai gudang data terlengkap di dunia mengenai apa yang terjadi di berbagai negara di seluruh dunia, Data Terbuka Bank Dunia adalah sumber penting dari Data Terbuka. Ini juga menyediakan akses ke kumpulan data lain juga yang disebutkan dalam katalog data.

Open Data Bank Dunia tergolong masif karena memiliki 3000 dataset dan 14000 indikator yang meliputi microdata, statistik time series, dan data geospasial.

Mengakses dan menemukan data yang Anda inginkan juga cukup mudah. Yang perlu Anda lakukan adalah menentukan nama indikator, negara atau topik dan ini akan membuka gudang penyimpanan Data Terbuka untuk Anda. Ini juga memungkinkan Anda mengunduh data dalam berbagai format seperti CSV, Excel, dan XML.

Jika Anda seorang jurnalis atau akademisi, Anda akan terpesona oleh berbagai alat yang tersedia untuk Anda. Anda bisa mendapatkan akses ke alat analisis dan visualisasi yang dapat mendukung penelitian Anda. Ini dapat mendorong pemahaman yang lebih dalam dan lebih baik tentang masalah global.

Anda bisa mendapatkan akses ke API yang dapat membantu Anda membuat visualisasi data yang Anda butuhkan, kombinasi langsung dengan sumber data lain, dan banyak lagi fitur semacam itu.

Oleh karena itu, tidak mengherankan jika Data Terbuka Bank Dunia menduduki peringkat teratas dalam daftar sumber Data Terbuka!

2. WHO (Organisasi Kesehatan Dunia) - Penyimpanan data terbuka

Penyimpanan Data Terbuka WHO adalah cara WHO melacak statistik khusus kesehatan dari 194 Negara Anggotanya.

Repositori menyimpan data secara sistematis. Itu dapat diakses sesuai kebutuhan yang berbeda. Misalnya, apakah itu kematian atau beban penyakit, seseorang dapat mengakses data yang diklasifikasikan di bawah 100 atau lebih kategori seperti Tujuan Pembangunan Milenium (gizi anak, kesehatan anak, kesehatan ibu dan reproduksi, imunisasi, HIV / AIDS, tuberkulosis, malaria, penyakit terabaikan, air dan sanitasi), penyakit tidak menular dan faktor risiko, penyakit rawan epidemi, sistem kesehatan, kesehatan lingkungan, kekerasan dan cedera, keadilan dll.

Untuk kebutuhan spesifik Anda, Anda dapat menelusuri kumpulan data sesuai dengan tema, kategori, indikator, dan negara.

Hal baiknya adalah dimungkinkan untuk mengunduh data apa pun yang Anda butuhkan dalam Format Excel. Anda juga dapat memantau dan menganalisis data dengan memanfaatkan portal datanya.

API untuk data Organisasi Kesehatan Dunia dan konten statistik juga tersedia.

3. Penjelajah Data Publik Google

Diluncurkan pada tahun 2010, Penjelajah Data Publik Google dapat membantu Anda menjelajahi sejumlah besar kumpulan data kepentingan publik. Anda dapat memvisualisasikan dan mengkomunikasikan data untuk penggunaan Anda masing-masing.

Itu membuat data dari berbagai lembaga dan sumber tersedia. Misalnya, Anda dapat mengakses data dari Bank Dunia, Biro Statistik Tenaga Kerja AS dan Biro AS, OECD, IMF, dan lainnya.

Pemangku kepentingan yang berbeda mengakses data ini untuk berbagai tujuan. Apakah Anda seorang pelajar atau jurnalis, apakah Anda pembuat kebijakan atau akademisi, Anda dapat memanfaatkan alat ini untuk membuat visualisasi data publik.

Anda dapat menerapkan berbagai cara untuk merepresentasikan data seperti grafik garis, grafik batang, peta dan grafik gelembung dengan bantuan Data Explorer.

Bagian terbaiknya adalah Anda akan menemukan visualisasi ini cukup dinamis. Artinya, Anda akan melihatnya berubah seiring waktu. Anda dapat mengubah topik, fokus pada entri yang berbeda dan mengubah skala.

Ini juga mudah dibagikan. Segera setelah Anda menyiapkan bagan, Anda dapat menyematkannya di situs web atau blog Anda atau cukup berbagi tautan dengan teman-teman Anda.

4. Registri Data Terbuka di AWS (RODA)

Ini adalah repositori yang berisi kumpulan data publik. Ini adalah data yang tersedia dari sumber daya AWS.

Sejauh menyangkut RODA, Anda dapat menemukan dan membagikan data yang tersedia untuk umum.

Di RODA, Anda dapat menggunakan kata kunci dan tag untuk jenis data umum seperti genomik, citra satelit, dan transportasi untuk mencari data apa pun yang Anda cari. Semua ini dimungkinkan pada antarmuka web yang sederhana.

Untuk setiap dataset, Anda akan menemukan halaman detail, contoh penggunaan, informasi lisensi dan tutorial atau aplikasi yang menggunakan data ini.

Dengan memanfaatkan berbagai produk komputasi dan analitik data, Anda dapat menganalisis data terbuka dan membangun layanan apa pun yang Anda inginkan.

Meskipun data yang Anda akses tersedia melalui sumber daya AWS, Anda perlu ingat bahwa itu tidak disediakan oleh AWS. Data ini milik berbagai lembaga, organisasi pemerintah, peneliti, bisnis, dan individu.

5. Portal Data Terbuka Uni Eropa

Anda dapat mengakses data terbuka apa pun yang diterbitkan oleh lembaga, lembaga, dan organisasi UE lainnya pada satu platform yaitu Portal Data Terbuka Uni Eropa.

Portal Data Terbuka UE adalah rumah bagi data terbuka penting yang berkaitan dengan domain kebijakan UE. Domain kebijakan ini mencakup ekonomi, pekerjaan, sains, lingkungan, dan pendidikan.

Sekitar 70 lembaga, organisasi, atau departemen UE seperti Eurostat, Badan Lingkungan Eropa, Pusat Penelitian Bersama, dan Direktorat Jenderal Komisi Eropa lainnya, serta Badan UE telah mempublikasikan kumpulan data mereka dan mengizinkan akses. Dataset ini telah melewati jumlah 11700 hingga saat ini.

Portal memungkinkan akses yang mudah. Anda dapat dengan mudah mencari, menjelajahi, menautkan, mengunduh, dan menggunakan kembali data melalui katalog metadata umum. Anda dapat melakukannya untuk tujuan spesifik Anda. Bisa untuk tujuan komersial atau non-komersial.

Anda dapat mencari katalog metadata melalui mesin pencari interaktif (tab Data) dan kueri SPARQL (tab data yang ditautkan).

Dengan menggunakan katalog ini, Anda dapat memperoleh akses ke data yang disimpan di berbagai situs web lembaga, lembaga, dan organisasi UE.

6. FiveThirtyEight

Ini adalah situs yang bagus untuk jurnalisme berbasis data dan bercerita.

Ini menyediakan berbagai sumber data untuk berbagai sektor seperti politik, olahraga, sains, ekonomi, dll. Anda juga dapat mengunduh datanya.

Saat Anda mengakses data, Anda akan mendapatkan penjelasan singkat tentang setiap dataset sehubungan dengan sumbernya. Anda juga akan mengetahui apa itu singkatan dan bagaimana menggunakannya.

Untuk membuat data ini ramah pengguna, ini menyediakan set data sesederhana mungkin, format non-kepemilikan seperti file CSV. Tak perlu dikatakan lagi, format ini dapat dengan mudah diakses dan diproses oleh manusia maupun mesin.

Dengan bantuan kumpulan data ini, Anda dapat membuat cerita dan visualisasi sesuai kebutuhan dan preferensi Anda sendiri.

7. Biro Sensus AS

Biro Sensus AS adalah badan statistik terbesar dari pemerintah federal. Ini menyimpan dan memberikan fakta dan data yang dapat diandalkan mengenai orang, tempat, dan ekonomi Amerika.

Biro Sensus menganggap misi mulianya untuk memperluas layanannya sebagai penyedia data berkualitas yang paling andal.

Baik itu pemerintah federal, negara bagian, lokal atau kesukuan, semuanya menggunakan data sensus untuk berbagai tujuan. Pemerintah ini menggunakan data ini untuk menentukan lokasi perumahan baru dan fasilitas umum. Mereka juga memanfaatkannya pada saat memeriksa karakteristik demografis komunitas, negara bagian, dan AS.

Data ini juga digunakan dalam perencanaan sistem transportasi dan jalan raya. Dalam hal menentukan kuota dan membuat polisi dan pemadam kebakaran, data ini sangat berguna. Ketika pemerintah membuat area pemilihan lokal, sekolah, utilitas, dll, mereka menggunakan data ini. Merupakan praktik untuk mengumpulkan informasi kependudukan sekali dalam satu dekade dan data ini cukup berguna untuk mencapai hal yang sama.

Ada berbagai alat seperti American Fact Finder, Census Data Explorer dan Quick Facts yang berguna jika Anda ingin mencari, menyesuaikan dan memvisualisasikan data.

Misalnya, Fakta Singkat sendiri berisi statistik untuk semua negara bagian, kabupaten, kota besar, dan bahkan kota kecil dengan populasi 5.000 atau lebih.

Demikian pula, American Fact Finder dapat membantu Anda menemukan fakta populer seperti populasi, pendapatan, dll. Ini memberikan informasi yang sering diminta.

Hal baiknya adalah Anda dapat mencari, berinteraksi dengan data, mengetahui tentang statistik populer, dan melihat bagan terkait melalui Penjelajah Data Sensus. Selain itu, Anda juga dapat menggunakan alat visual untuk menyesuaikan data pada pengalaman peta interaktif.

8. Data.gov

Data.gov adalah gudang penyimpanan data terbuka pemerintah AS. Baru belakangan ini keputusan dibuat untuk membuat semua data pemerintah tersedia secara gratis.

Saat diluncurkan, hanya ada 47. Saat ini ada 180.000 dataset.

Mengapa Data.gov adalah sumber daya yang hebat karena Anda dapat menemukan data, alat, dan sumber daya yang dapat Anda terapkan untuk berbagai tujuan. Anda dapat melakukan penelitian, mengembangkan aplikasi web dan seluler, dan bahkan merancang visualisasi data.

Yang perlu Anda lakukan adalah memasukkan kata kunci di kotak pencarian dan menelusuri jenis, tag, format, grup, jenis organisasi, organisasi, dan kategori. Ini akan memudahkan akses ke data atau dataset yang Anda butuhkan.

Data.gov mengikuti Skema Data Terbuka Proyek - seperangkat bidang yang diperlukan (Judul, Deskripsi, Tag, Pembaruan Terakhir, Penerbit, Nama Kontak, dll.) Untuk setiap kumpulan data yang ditampilkan di Data.gov.

9. DBpedia

Seperti yang Anda ketahui, Wikipedia adalah sumber informasi yang bagus. DBpedia bertujuan untuk mendapatkan konten terstruktur dari informasi berharga yang dibuat Wikipedia.

Dengan DBpedia, Anda dapat mencari dan menjelajahi hubungan dan properti sumber daya Wikipedia secara semantik. Ini termasuk tautan ke kumpulan data terkait lainnya juga.

Ada sekitar 4,58 juta entitas dalam dataset DBpedia. 4,22 juta diklasifikasikan dalam ontologi, termasuk 1.445.000 orang, 735.000 tempat, 123.000 album musik, 87.000 film, 19.000 video game, 241.000 organisasi, 251.000 spesies, dan 6.000 penyakit.

Ada label dan abstrak untuk entitas ini dalam sekitar 125 bahasa. Ada 25,2 juta tautan ke gambar. Ada 29,8 juta link ke halaman web eksternal.

Yang perlu Anda lakukan untuk menggunakan DBpedia adalah menulis kueri SPARQL terhadap endpoint atau dengan mengunduh dumpnya.

DBpedia telah menguntungkan beberapa perusahaan, seperti Apple (melalui Siri), Google (melalui Freebase dan Google Knowledge Graph), dan IBM (melalui Watson), dan khususnya proyek bergengsi masing-masing yang terkait dengan kecerdasan buatan.

10. Data Terbuka freeCodeCamp

Ini adalah komunitas open source. Mengapa ini penting adalah karena ini memungkinkan Anda membuat kode, membangun proyek pro bono setelah lembaga nonprofit, dan mengambil pekerjaan sebagai pengembang.

Untuk mewujudkannya, komunitas freeCodeCamp.org menyediakan data dalam jumlah besar setiap bulan. Mereka telah mengubahnya menjadi data terbuka.

Anda akan menemukan berbagai macam hal di repositori ini. Anda dapat menemukan kumpulan data, analisis proyek yang sama, dan bahkan demo berdasarkan data freeCodeCamp. Anda juga dapat menemukan tautan ke proyek eksternal yang melibatkan data freeCodeCamp.

Ini dapat membantu Anda dengan keragaman proyek dan tugas yang mungkin ada dalam pikiran Anda. Baik itu analisis web, analisis media sosial, analisis jejaring sosial, analisis pendidikan, visualisasi data, pengembangan web berbasis data atau bot, data yang ditawarkan oleh komunitas ini dapat sangat berguna dan efektif.

11. Yelp Buka Kumpulan Data

Dataset Yelp pada dasarnya adalah bagian dari data bisnis, ulasan, dan pengguna kami sendiri untuk digunakan dalam kegiatan pribadi, pendidikan, dan akademis.

Ada 5.996.996 review, 188.593 bisnis, 280.991 gambar dan 10 area metropolitan termasuk dalam Yelp Open Datasets.

Anda dapat menggunakannya untuk tujuan yang berbeda. Karena tersedia sebagai file JSON, Anda dapat menggunakannya untuk mengajar siswa tentang database. Anda dapat menggunakannya untuk mempelajari NLP atau untuk data produksi sampel sambil memahami cara merancang aplikasi seluler.

Dalam dataset ini, Anda akan menemukan setiap file yang terdiri dari satu jenis objek, satu objek JSON per baris.

12. Set Data UNICEF

Karena UNICEF memperhatikan berbagai masalah kritis, UNICEF telah mengumpulkan data yang relevan tentang pendidikan, pekerja anak, cacat anak, kematian anak, kematian ibu, air dan sanitasi, berat badan lahir rendah, perawatan antenatal, pneumonia, malaria, defisiensi yodium. gangguan, mutilasi / pemotongan alat kelamin wanita, dan remaja.

Kumpulan data terbuka UNICEF yang diterbitkan di IATI Registry: //www.iatiregistry.org/publisher/unicef ​​telah diekstraksi langsung dari sistem operasi UNICEF (VISION) dan sistem data lainnya, dan mencerminkan masukan yang dibuat oleh masing-masing kantor UNICEF.

Hal baiknya adalah ada pembaruan rutin terkait dengan kumpulan data ini. Setiap bulan, data diperbarui agar lebih lengkap, andal, dan akurat.

Anda dapat dengan bebas dan mudah mengakses data ini. Untuk melakukannya, Anda dapat mendownload data ini dalam format CSV. Anda juga dapat melihat data sampel sebelum mendownloadnya.

Sementara siapa pun dapat menjelajahi dan memvisualisasikan kumpulan data UNICEF, ada tiga penerbit utama:

AID TRANSPARENCY PORTAL UNICEF: Anda dapat mengakses dataset dengan lebih mudah jika Anda menggunakan portal ini. Ini juga mencakup perincian untuk setiap negara tempat UNICEF bekerja.

D-portal penerbit: Saat ini, dalam BETA. Dengan portal ini, Anda dapat menjelajahi data IATI.

Anda dapat mencari informasi yang berkaitan dengan kegiatan pembangunan, anggaran, dll. Anda dapat menjelajahi informasi ini berdasarkan negara.

Platform data penerbit: Pada platform ini, Anda dapat dengan mudah mengakses statistik, bagan, dan metrik pada data yang diakses melalui IATI Registry. Jika Anda mengklik header, Anda juga dapat mengurutkan banyak tabel yang Anda lihat di platform. Anda juga akan menemukan banyak set data di platform dalam format JSON yang dapat dibaca mesin.

13. Kaggle

Kaggle sangat bagus karena mempromosikan penggunaan format publikasi set data yang berbeda. Namun, bagian terbaiknya adalah sangat disarankan agar penerbit set data membagikan datanya dalam format non-kepemilikan yang dapat diakses.

Platform ini mendukung format data yang terbuka dan dapat diakses. Ini penting tidak hanya untuk akses tetapi juga untuk apa pun yang ingin Anda lakukan dengan data ini. Oleh karena itu, Kaggle Dataset dengan jelas mendefinisikan format file yang direkomendasikan saat berbagi data.

Hal unik tentang kumpulan data Kaggle adalah bahwa ini bukan hanya tempat penyimpanan data. Setiap set data mewakili komunitas yang memungkinkan Anda mendiskusikan data, mengetahui kode dan teknik publik, dan membuat konsep proyek Anda sendiri di Kernels.

CSV, JSON, SQLite, Archive, Big Query, dll. Adalah jenis file yang didukung Kaggle. Anda dapat menemukan berbagai sumber daya untuk mulai mengerjakan proyek data terbuka Anda.

Bagian terbaiknya adalah Kaggle memungkinkan Anda untuk menerbitkan dan berbagi kumpulan data secara pribadi atau publik.

14. LODUM

Ini adalah prakarsa Data Terbuka dari Universitas Münster. Di bawah inisiatif ini, siapa pun dapat mengakses informasi publik apa pun tentang universitas dalam format yang dapat dibaca mesin. Anda dapat dengan mudah mengakses dan menggunakannya kembali sesuai kebutuhan Anda.

Data terbuka tentang artefak ilmiah dan dikodekan sebagai data tertaut tersedia dalam proyek ini.

Dengan bantuan Data Tertaut, dimungkinkan untuk berbagi dan menggunakan data, ontologi, dan berbagai standar metadata. Faktanya, diharapkan bahwa ini akan menjadi standar yang diterima untuk menyediakan metadata, dan datanya sendiri di Web.

Tim LODUM telah bersama-sama memprakarsai LinkedUniversities.org dan LinkedScience.org.

Anda dapat menggunakan editor SPARQL atau paket SPARQL R untuk menganalisis data.

Paket SPARQL memungkinkan untuk terhubung ke titik akhir SPARQL melalui HTTP, mengajukan kueri SELECT atau kueri pembaruan (LOAD, INSERT, DELETE).

15. Tempat Penyimpanan Pembelajaran Mesin UCI

Ini berfungsi sebagai gudang komprehensif database, teori domain, dan generator data yang digunakan oleh komunitas pembelajaran mesin untuk analisis empiris algoritma pembelajaran mesin.

Dalam repositori ini, saat ini terdapat 463 set data sebagai layanan untuk komunitas pembelajaran mesin.

Pusat Pembelajaran Mesin dan Sistem Cerdas di Universitas California, Irvine menyelenggarakan dan memeliharanya. David Aha awalnya membuatnya sebagai mahasiswa pascasarjana di UC Irvine.

Sejak itu, siswa, pendidik, dan peneliti di seluruh dunia memanfaatkannya sebagai sumber kumpulan data machine learning yang andal.

Cara kerjanya adalah setiap kumpulan data memiliki halaman web yang berbeda yang mencatat semua detail yang diketahui termasuk publikasi relevan yang menyelidikinya. Anda dapat mendownload kumpulan data ini sebagai file ASCII, biasanya dalam format CSV yang berguna.

Detail dataset dirangkum berdasarkan aspek-aspek seperti tipe atribut, jumlah instance, jumlah atribut dan tahun terbit yang dapat diurutkan dan dicari.

Portal Data Terbuka dan Mesin Pencari:

Meskipun ada banyak kumpulan data yang diterbitkan oleh banyak lembaga setiap tahun, sangat sedikit kumpulan data yang diakui dan ditetapkan.

Alasan mengapa sangat sedikit kumpulan data yang dipertahankan sebagai sumber daya yang berguna adalah karena merupakan tantangan untuk mengembangkan, mengelola, dan menyediakan data dengan cara yang bermanfaat dan mudah digunakan oleh orang dan organisasi.

Namun, di bawah ini, harap temukan daftar beberapa portal dan platform data terbuka penting lainnya yang memungkinkan pengguna mengakses data terbuka dengan cukup mudah, mempelajari dampaknya, dan mengumpulkan wawasan berharga.

  1. Pencarian dataset Google
  2. Dataverse
  3. Buka Kit Data
  4. Ckan
  5. Buka Monitor Data
  6. Plenar.io
  7. Peta Dampak Data Terbuka

Kesimpulan

Data terbuka adalah urutan hari ini. Dunia secara bertahap mulai bergerak menuju sistem terbuka dan data terbuka selaras dengan itu.

Bisnis dan organisasi yang memanfaatkan data terbuka akan memperoleh keunggulan kompetitif dan akan mampu mendominasi masa depan.