به دنبال داده رایگان برای تمرین مهارت های تجزیه و تحلیل داده خود هستید؟ در اینجا برخی از وب سایت های برتر برای بررسی وجود دارد.
چه در حال انجام تحقیقات بازار باشید، چه به عنوان یک تحلیلگر، پورتفولیوی خود را ایجاد کنید، یا به دنبال بینش هایی برای گسترش دامنه بازار خود باشید، داده های ارزشمند و قابل اعتماد برای تصمیم گیری آگاهانه ضروری است.
با این حال، جستجوی اینترنت برای دادههای رایگان، قابل اعتماد و قابل دسترس دارای چالشهایی است. این مقاله با معرفی برخی از وبسایتهای برتر برای دسترسی به دادههای رایگان، چالش جستجوی داده شما را کمتر میکند.
1. Google Trends
Google Trends یک سرویس رایگان است که توسط Google توسعه یافته است که نمونههای اطلاعاتی فیلتر نشده درخواستهای جستجو به Google را در اختیار کاربران قرار میدهد. در حالی که این سرویس داده های سری زمانی را از سال 2004 تا کنون در مقیاس جهانی و سطح شهر نمایش می دهد، جزئیات شخصی کاربران موتور جستجو را نشان نمی دهد.
همچنین میتوانید دادهها را محدود کنید تا روی دستهها، زبانها، نهادها یا جستجوهای پرطرفدار در Google با Google Trends تمرکز کنند. نمونههایی از دادههای موجود شامل روندهای جستجوی روزانه و روندهای جستجوی همزمان است که دادههای هفت روز گذشته را نشان میدهد.
2. FiveThirtyEight
FiveThirtyEight یک وب سایت روزنامه نگاری داده است که داده هایی در مورد تجزیه و تحلیل نظرسنجی، ورزش، فرهنگ عامه، سیاست، علم و رویدادهای اقتصادی دارد.
نکته مهم در مورد وب سایت این است که می توانید داده ها را از وب سایت آنها یا مخزن رسمی GitHub آنها دانلود کنید و از ابزارهای تجسم داده های خود برای ایجاد تصاویری جذاب از روزنامه نگاری داده برای مخاطبان خود استفاده کنید. چند نمونه از داده های جالب موجود شامل پیش بینی های جام جهانی و داده های پیش بینی NHL 2022-23 است.
3. BuzzFeed News
BuzzFeed News یک پلت فرم گزارش فوری و اصلی آمریکایی است که همه چیز را از روزنامه نگاری، فناوری، سرگرمی، اخبار افراد مشهور، فرهنگ و هک های DIY گرفته تا سلامت و سیاست گزارش می کند.
BuzzFeed News در GitHub خود، مجموعه داده ها، ابزارها و تجزیه و تحلیل خود را از اتاق خبر BuzzFeed منبع باز، در دسترس و در دسترس قرار می دهد. یک مثال شامل دادههای بررسی پسزمینه سلاح گرم FBI NICS است.
4. Data.gov
Data.gov وبسایت دادههای باز دولت ایالات متحده است که میزبان بیش از 250000 مجموعه داده کاملاً مستند و در دسترس عموم از آژانسهای بینالمللی و چند سازمان دولتی فدرال است. ایده پشت این ابتکار ایجاد یک دولت باز و شفاف بود.
می توانید بر اساس موضوع و آژانس یا سازمان به داده ها از وب سایت دسترسی پیدا کنید. برخی از نمونههایی از دادههایی که میتوانید در Data.gov بیابید، سیستم ملی دادههای وام دانشجویی و دادههای جمعیت خودروهای الکتریکی است.
5. Kaggle
Kaggle یک زمین بازی داده عمومی است که توسط Google خریداری شده است که طیف گسترده ای از مجموعه داده ها را در موضوعات مختلف ارائه می دهد. این پلتفرم انجمن به شما امکان می دهد کدهای خود را به اشتراک بگذارید، یاد بگیرید، با متخصصان داده همکاری کنید و مهارت کسب کنید. Kaggle همچنین میزبان مسابقات علم داده است که در آن می توانید جوایز مختلفی را برنده شوید.
این راهنما یک راهنمای مبتدی در مورد نحوه شروع کار با Kaggle برای علم داده ارائه می دهد. به عنوان مثال، آمار جهانی YouTube 2023 است.
6. داده های زمین از ناسا
EarthData یک ابتکار داده توسط ناسا است که به عنوان مخزن داده های زمین از سال 1994 تا کنون خدمت می کند. شما می توانید داده های مربوط به اطلاعات ماهواره ای از راه دور تا داده های مربوط به جو زمین، اقیانوس ها و هیدروکره زمینی را دریافت کنید.
می توانید موضوعات مختلف را مرور کنید و به داده هایی مانند داده های گرمای شدید دسترسی پیدا کنید. با این حال، شما باید سیستم داده های سیاره ای ناسا را برای داده های غیر زمینی بررسی کنید.
7. مجموعه داده های IMDb
IMDb دادههایی درباره فیلمها، سریالهای تلویزیونی، ویدیوهای خانگی، پادکستها، بازیهای ویدیویی، جریان اطلاعات و محتوای افراد مشهور ارائه میدهد. یک مثال مجموعه داده های غیرتجاری IMDb است.
8. مجموعه داده های عمومی AWS
مجموعه داده های عمومی AWS وب سایتی است که میزبان بیش از 3000 مجموعه داده از مجموعه داده هایی است که از طریق سرویس های AWS در دسترس عموم قرار گرفته اند. اکثر مجموعه داده های اینجا مبتنی بر پروژه هستند. چند مورد شامل اطلس ژنوم سرطان و مجموعه داده های Foldingathome COVID-19 است.
9. داخل Airbnb
Inside Airbnb یک وب سایت دیده بان است که توسط موری کاکس راه اندازی شده است. این وبسایت دادههایی را که به صورت عمومی در دسترس است از Airbnb، پلتفرمی که اتاقهای مقرونبهصرفه در سراسر جهان را به کاربران ارائه میدهد، منبع میدهد. شما می توانید از اطلاعات این سایت برای انجام تجزیه و تحلیل مانند تجزیه و تحلیل اجاره مونترال استفاده کنید.
10. جستجوی مجموعه داده های گوگل
Google Dataset Search یک موتور جستجوی مجموعه داده است که توسط Google ایجاد شده است که میزبان بیش از 20 میلیون مجموعه داده است. مانند موتور جستجوی آنها، تقریباً از هر چیزی می توانید داده دریافت کنید. یک مثال خوب، داده های پایش بلند مدت کیفیت آب ملی کانادا است.
11. مخزن یادگیری ماشین UCI
UC Irvine Machine Learning Repository خانه 624 مجموعه داده برای جامعه یادگیری ماشین در جهان است. این وب سایت از شهرت بالایی در جامعه برخوردار است زیرا مجموعه داده ها بر اساس وظایف یادگیری ماشینی که برای آنها مناسب است طبقه بندی می شوند. به عنوان مثال مجموعه داده Iris، یک مجموعه داده مدل طبقه بندی و خوشه بندی معروف است.
12. Datahub.io
Datahub به عنوان یک پلتفرم دارای مجموعه داده های زیادی است که طیف گسترده ای از موضوعات مانند بازده اوراق قرضه 10 ساله دولت ایالات متحده (نرخ بهره بلند مدت) را پوشش می دهد. علاوه بر داده ها، آنها همچنین ابزارهای داده و جعبه ابزاری را نمایش می دهند که می توانند برای متخصصان داده ارائه شوند.
13. مخزن داده های رصدخانه بهداشت جهانی
این اولین وب سایت در لیست ما برای داده های بهداشتی انحصاری است. رصدخانه جهانی بهداشت به عنوان مخزن داده ای عمل می کند که آمارهای مرتبط با سلامت را برای بیش از 1000 شاخص برای 194 کشور عضو WHO نمایش می دهد. داده ها برای نظارت بر پیشرفت این کشورهای عضو به سمت اهداف SDG ثبت می شود. میتوانید با فیلتر کردن موضوع، دسته، ابرداده و نشانگر دادهها، دادهها را دریافت کنید.
14. موسسه فیلم بریتانیا
این پلت فرم واقعاً مبتنی بر طاقچه است. این دادههای تحقیقاتی و اطلاعات هوش بازار مانند ارقام باکس آفیس آخر هفته و دادههای مرتبط در صنعت فیلم بریتانیا را نشان میدهد.
15. GitHub
GitHub چیزی بیش از خانه میلیون ها پروژه مشترک و منبع باز است. این پلتفرم همچنین میزبان بسیاری از مخازن است که هدف آنها نگهداری مجموعه داده های رایگان، عمومی و منبع باز است. حتی BuzzFeedNews نیز یک مخزن منبع باز GitHub دارد.
نمونههای دیگر مخزن Awesome Public Datasets هستند و آیا حتی مجموعه دادهها را بالا میبرید. شما همچنین می توانید در این پروژه های منبع باز در GitHub مشارکت کنید.
16. Data.world
Data.world یک جامعه داده و پلت فرم مشترک است که میزبان پروژه های داده و مجموعه داده ها است. در حالی که تعداد کمی از مجموعه داده ها پرداخت می شوند، بیشتر داده های روی پلت فرم، مانند Makeover Monday’s 2021/W16: مسافران هوایی ماهانه در آمریکا، رایگان هستند و می توان آنها را به راحتی به صورت محلی دانلود کرد یا از طریق API آنها به آنها دسترسی داشت.
17. داده های باز بانک جهانی
داده های باز بانک جهانی فهرستی از داده های اقتصادی و توسعه جهانی است. می توانید داده ها را مرور و فیلتر کنید، مانند آمار جهانی در مورد هزینه و مقرون به صرفه بودن رژیم های غذایی سالم بر اساس شاخص و کشور.
18. داده های NASDAQ
Nasdaq Data Link برای همه داده های مالی، اقتصادی و جایگزین است. می توانید از طریق صفحه گسترده ای مانند Excel یا API به داده هایی مانند انتشار داده های ذخیره فدرال ایالات متحده دسترسی داشته باشید.
19. NYC TLC
پلت فرم داده کمیسیون تاکسی و لیموزین نیویورک، اطلاعاتی مانند سوابق سفر تاکسی های زرد و سبز را در سراسر شهر نیویورک ثبت و میزبانی می کند. نکته مهم در مورد این وب سایت این است که اطلاعاتی در مورد همه چیز نشان می دهد، از حمل و نقل / تحویل گرفته تا منطقه تاکسی و کرایه سفر.
20. تورنت های آکادمیک
Academic Torrents یک کاتالوگ داده با بیش از 127.15 ترابایت داده تحقیقاتی است. آن طور که می گویند برای محققان و توسط محققان ساخته شده است.
کاوش کنید و بیاموزید
امیدواریم با این لیست، بتوانید داده هایی را به دست آورید که می تواند چشم انداز کسب و کار شما را شکل دهد، تحقیقات بازار شما را هدایت کند، مزیت رقابتی به دست آورید، و به شما کمک کند تا مجموعه داده های منحصر به فرد را به صورت رایگان بسازید. بنابراین فرصت ها را در آغوش بگیرید، کاوش کنید، و یک تلاش کمتر چالش برانگیز برای شکار داده داشته باشید.