با این ماژول پایتون، داده های جغرافیایی ساده و مفیدی را دریافت کنید.
روزهایی را به خاطر می آورید که از یک کره فیزیکی استفاده می کردید یا یک کتاب سنگین بزرگ را اسکن می کردید تا نام مناطق و کشورهای مختلف را بیابید؟ با پیشرفت تکنولوژی، به ویژه اینترنت، همه این اطلاعات اکنون با کلیک یک دکمه در دسترس هستند.
اما اگر بخواهید قدمی فراتر بردارید و اطلاعات ضروری در مورد یک کشور مانند پایتخت، مختصات جغرافیایی یا واحد پول آن کشور را بیابید، چه؟ به ماژول اطلاعات شگفتانگیز کشور پایتون که میتواند کار را در عرض چند ثانیه انجام دهد، نگاه نکنید.
ماژول CountryInfo چیست؟
Porimol Chandro ماژول اطلاعات کشور را توسعه داد. عملکردهایی برای واکشی پایتخت کشور، مختصات جغرافیایی، منطقه زمانی، منطقه، جمعیت و موارد دیگر دارد.
برای نصب این ماژول، ترمینال خود را باز کرده و اجرا کنید:
pip install countryinfo
همچنین میتوانید دادههای آبوهوای زنده هر کشور یا منطقه را واکشی کنید و از آن همراه با اطلاعات استفاده کنید و مجموعه دادههای خود را افزایش دهید.
نحوه استفاده از توابع ماژول
می توانید اطلاعات را با استفاده از عملکردهای مختلف ماژول CountryInfo به شرح زیر واکشی کنید.
1. دریافت اسامی یا املای جایگزین یک کشور
میتوانید نامهای جایگزین یا املای کشورهایی مانند این را واکشی کنید:
from countryinfo import CountryInfo
name = 'India'
country = CountryInfo(name)
data1 = country.alt_spellings()
print(data1)
با وارد کردن کلاس CountryInfo از ماژول countryinfo شروع کنید. سپس می توانید یک نمونه از CountryInfo را با ارسال رشته ای حاوی نام کشور ایجاد کنید.
می توانید متدهای API مختلفی را در شی CountryInfo که ایجاد کرده اید فراخوانی کنید. به عنوان مثال، alt_spellings() لیستی از نام های جایگزین کشور را برمی گرداند.
قطعه پایتون برای دریافت نام های جایگزین یک کشور خروجی زیر را تولید می کند:
2. بدست آوردن پایتخت و مختصات جغرافیایی آن
برای بدست آوردن پایتخت هر کشوری می توانید از capital() استفاده کنید. یک رشته نشان دهنده نام پایتخت را برمی گرداند:
data2 = country.capital()
print(data2)
این قطعه پایتون خروجی زیر را تولید می کند:
از روش API captial_latlng() برای واکشی مختصات جغرافیایی پایتخت یک کشور استفاده کنید. این روش یک لیست حاوی دو عنصر را برمیگرداند که هر کدام یک عدد ممیز شناور است:
data3 = country.capital_latlng()
print(data3)
قطعه پایتون برای بدست آوردن عرض و عرض جغرافیایی یک کشور خروجی زیر را تولید می کند:
3. بدست آوردن منطقه یک کشور، استانها و کشورهای مرزی اطراف آن
شما می توانید از متد API، area() برای بدست آوردن مساحت هر کشور به کیلومتر مربع استفاده کنید. کد را به صورت زیر پیاده کنید:
data4 = country.area()
print(data4)
قطعه پایتون برای بدست آوردن مساحت یک کشور خروجی زیر را تولید می کند:
شما می توانید لیستی از استان های یک کشور را با استفاده از provinces() دریافت کنید. هر عنصر در لیست یک رشته است که یک استان را نشان می دهد. کد را به صورت زیر پیاده کنید:
data5 = country.provinces()
print(data5)
قطعه پایتون برای دریافت استان های یک کشور خروجی زیر را تولید می کند:
می توانید نام کشورهای هم مرز را با استفاده از متد API، borders() واکشی کنید. هر عنصر در لیست یک کد کشور در قالب ISO-3، یک رشته سه نویسه بزرگ است. کد را به صورت زیر پیاده کنید:
data6 = country.borders()
print(data6)
قطعه پایتون برای دریافت نام کشورهای مرزی خروجی زیر را تولید می کند:
4. دریافت کدهای تماس یک کشور
می توانید کدهای تماس بین المللی یک کشور را با استفاده از calling_codes() واکشی کنید. این فهرستی از رشتهها را برمیگرداند که هر کدام حاوی پیشوند شماره تلفنی است که برای تماس با کشور دیگر نیاز دارید:
data7 = country.calling_codes()
print(data7)
قطعه پایتون برای دریافت کدهای تماس یک کشور خروجی زیر را تولید می کند:
5. دریافت ارز، جمعیت، و مناطق زمانی
فرمت ارز رسمی یک کشور را با استفاده از روش API، currencies() واکشی کنید. این متد لیست دیگری از رشته ها را برمی گرداند:
data8 = country.currencies()
print(data8)
قطعه پایتون برای بدست آوردن واحد پول یک کشور خروجی زیر را تولید می کند:
تعداد تقریبی افرادی که در یک کشور زندگی می کنند با استفاده از جمعیت () واکشی کنید. این متد یک int را برمی گرداند. اینطوری استفاده کن:
data9 = country.population()
print(data9)
قطعه پایتون برای بدست آوردن جمعیت یک کشور خروجی زیر را تولید می کند:
یک کشور بسته به اندازه آن ممکن است یک یا چند منطقه زمانی داشته باشد. می توانید مناطق زمانی مختلف یک کشور را با استفاده از متد API timezones() به صورت زیر واکشی کنید:
data10 = country.timezones()
print(data10)
قطعه پایتون برای بدست آوردن مناطق زمانی مختلف یک کشور خروجی زیر را تولید می کند:
6. بدست آوردن منطقه و منطقه فرعی یک کشور
منطقه کلی یا قاره ای که یک کشور به آن تعلق دارد را با استفاده از روش API region() واکشی کنید. کد را به صورت زیر پیاده کنید:
data11 = country.region()
print(data11)
قطعه پایتون برای بدست آوردن منطقه یک کشور خروجی زیر را تولید می کند:
به طور مشابه، می توانید منطقه خاصی را که کشور به آن تعلق دارد با استفاده از subregion() به صورت زیر انجام دهید:
data12 = country.subregion()
print(data12)
قطعه پایتون برای بدست آوردن زیر منطقه یک کشور خروجی زیر را تولید می کند:
7. دریافت URL ویکی پدیا یک کشور
ویکی پدیا یکی از بهترین منابع اطلاعاتی برای هر چیزی در اینترنت است. شما می توانید صفحه ویکی پدیا یک کشور را با استفاده از متد API، wiki() واکشی کنید. کد را به صورت زیر پیاده کنید:
data13 = country.wiki()
print(data13)
قطعه پایتون برای دریافت صفحه ویکی پدیا یک کشور خروجی زیر را تولید می کند:
8. دریافت دامنه سطح بالا برای یک کشور
ccTLD یک نام دامنه سطح بالای کد کشور است که یک کشور یا منطقه جغرافیایی وب سایت را نشان می دهد. معمولاً دو حرف مانند .in برای هند و .ca برای کانادا است. می توانید دامنه سطح بالای یک کشور را با استفاده از tld() به صورت زیر واکشی کنید:
data14 = country.tld()
print(data14)
قطعه پایتون برای دریافت دامنه سطح بالای یک کشور خروجی زیر را تولید می کند:
9. دریافت تمام اطلاعات موجود در مورد یک کشور
شما می توانید تمام اطلاعات موجود یک کشور را با استفاده از متد API، info () واکشی کنید. یک فرهنگ لغت از مقادیر کلید/نام را برمیگرداند که میتوانید با استفاده از حلقه for آن را تکرار کنید:
data15 = country.info()
for key, value in data15.items():
print(key, ":", value)
قطعه پایتون برای دریافت تمام اطلاعات موجود در مورد یک کشور خروجی زیر را تولید می کند:
10. دریافت اطلاعات همه کشورها و ایجاد یک مجموعه داده
ماژول CountryInfo یک متد API به نام all() ارائه می دهد که یک فرهنگ لغت حاوی تمام اطلاعات همه کشورهای جهان را برمی گرداند:
from countryinfo import CountryInfo
import pandas as pd
country = CountryInfo()
data = country.all()
برای دستکاری این داده ها می توانید از ماژول pandas استفاده کنید. ماژول pandas دستورات زیادی را برای کار با DataFrames ارائه می دهد، از جمله یکی برای ذخیره داده ها در قالب CSV:
df = pd.DataFrame(data)
df.to_csv("Country_Data_Fetcher.csv")
واکشی داده ها از وب سایت ها
در حالی که این ماژول مفید پایتون تمام اطلاعات ضروری هر کشوری را ارائه می دهد، واکشی داده های تمیز کار آسانی نیست. دانش خراش دادن وب به شما کمک می کند تا داده ها را از هر وب سایتی در اینترنت واکشی کنید. سپس می توانید آن داده ها را در برنامه های خود تجزیه و تحلیل و استفاده کنید.
پایتون یک ماژول قدرتمند به نام BeautifulSoup دارد که میتوانید آن را نصب کنید تا وبسایت را انجام داده و ساعتها کار خود را ذخیره کنید.