خبر و ترفند روز

خبر و ترفند های روز را اینجا بخوانید!

یک برنامه پایتون برای واکشی داده‌های مربوط به هر کشوری بسازید

با این ماژول پایتون، داده های جغرافیایی ساده و مفیدی را دریافت کنید.

روزهایی را به خاطر می آورید که از یک کره فیزیکی استفاده می کردید یا یک کتاب سنگین بزرگ را اسکن می کردید تا نام مناطق و کشورهای مختلف را بیابید؟ با پیشرفت تکنولوژی، به ویژه اینترنت، همه این اطلاعات اکنون با کلیک یک دکمه در دسترس هستند.

اما اگر بخواهید قدمی فراتر بردارید و اطلاعات ضروری در مورد یک کشور مانند پایتخت، مختصات جغرافیایی یا واحد پول آن کشور را بیابید، چه؟ به ماژول اطلاعات شگفت‌انگیز کشور پایتون که می‌تواند کار را در عرض چند ثانیه انجام دهد، نگاه نکنید.

ماژول CountryInfo چیست؟

Porimol Chandro ماژول اطلاعات کشور را توسعه داد. عملکردهایی برای واکشی پایتخت کشور، مختصات جغرافیایی، منطقه زمانی، منطقه، جمعیت و موارد دیگر دارد.

برای نصب این ماژول، ترمینال خود را باز کرده و اجرا کنید:

pip install countryinfo

همچنین می‌توانید داده‌های آب‌وهوای زنده هر کشور یا منطقه را واکشی کنید و از آن همراه با اطلاعات استفاده کنید و مجموعه داده‌های خود را افزایش دهید.

نحوه استفاده از توابع ماژول

می توانید اطلاعات را با استفاده از عملکردهای مختلف ماژول CountryInfo به شرح زیر واکشی کنید.

1. دریافت اسامی یا املای جایگزین یک کشور

می‌توانید نام‌های جایگزین یا املای کشورهایی مانند این را واکشی کنید:

from countryinfo import CountryInfo
name = 'India'
country = CountryInfo(name)
data1 = country.alt_spellings()
print(data1)

با وارد کردن کلاس CountryInfo از ماژول countryinfo شروع کنید. سپس می توانید یک نمونه از CountryInfo را با ارسال رشته ای حاوی نام کشور ایجاد کنید.

می توانید متدهای API مختلفی را در شی CountryInfo که ایجاد کرده اید فراخوانی کنید. به عنوان مثال، alt_spellings() لیستی از نام های جایگزین کشور را برمی گرداند.

قطعه پایتون برای دریافت نام های جایگزین یک کشور خروجی زیر را تولید می کند:

املای جایگزین کشور

2. بدست آوردن پایتخت و مختصات جغرافیایی آن

برای بدست آوردن پایتخت هر کشوری می توانید از capital() استفاده کنید. یک رشته نشان دهنده نام پایتخت را برمی گرداند:

data2 = country.capital()
print(data2)

این قطعه پایتون خروجی زیر را تولید می کند:

مطلب مرتبط:   نحوه استفاده از مسیریابی پویا با جنگو

پایتخت کشور

از روش API captial_latlng() برای واکشی مختصات جغرافیایی پایتخت یک کشور استفاده کنید. این روش یک لیست حاوی دو عنصر را برمی‌گرداند که هر کدام یک عدد ممیز شناور است:

data3 = country.capital_latlng()
print(data3)

قطعه پایتون برای بدست آوردن عرض و عرض جغرافیایی یک کشور خروجی زیر را تولید می کند:

طول و عرض جغرافیایی پایتخت

3. بدست آوردن منطقه یک کشور، استانها و کشورهای مرزی اطراف آن

شما می توانید از متد API، area() برای بدست آوردن مساحت هر کشور به کیلومتر مربع استفاده کنید. کد را به صورت زیر پیاده کنید:

data4 = country.area()
print(data4)

قطعه پایتون برای بدست آوردن مساحت یک کشور خروجی زیر را تولید می کند:

منطقه کشور

شما می توانید لیستی از استان های یک کشور را با استفاده از provinces() دریافت کنید. هر عنصر در لیست یک رشته است که یک استان را نشان می دهد. کد را به صورت زیر پیاده کنید:

data5 = country.provinces()
print(data5)

قطعه پایتون برای دریافت استان های یک کشور خروجی زیر را تولید می کند:

استان های کشور

می توانید نام کشورهای هم مرز را با استفاده از متد API، borders() واکشی کنید. هر عنصر در لیست یک کد کشور در قالب ISO-3، یک رشته سه نویسه بزرگ است. کد را به صورت زیر پیاده کنید:

data6 = country.borders()
print(data6)

قطعه پایتون برای دریافت نام کشورهای مرزی خروجی زیر را تولید می کند:

مرزهای کشور

4. دریافت کدهای تماس یک کشور

می توانید کدهای تماس بین المللی یک کشور را با استفاده از calling_codes() واکشی کنید. این فهرستی از رشته‌ها را برمی‌گرداند که هر کدام حاوی پیشوند شماره تلفنی است که برای تماس با کشور دیگر نیاز دارید:

data7 = country.calling_codes()
print(data7)

قطعه پایتون برای دریافت کدهای تماس یک کشور خروجی زیر را تولید می کند:

کد تماس کشور

5. دریافت ارز، جمعیت، و مناطق زمانی

فرمت ارز رسمی یک کشور را با استفاده از روش API، currencies() واکشی کنید. این متد لیست دیگری از رشته ها را برمی گرداند:

data8 = country.currencies()
print(data8)

قطعه پایتون برای بدست آوردن واحد پول یک کشور خروجی زیر را تولید می کند:

مطلب مرتبط:   نحوه استفاده از پایتون برای معکوس کردن یک رشته

واحد پول کشور

تعداد تقریبی افرادی که در یک کشور زندگی می کنند با استفاده از جمعیت () واکشی کنید. این متد یک int را برمی گرداند. اینطوری استفاده کن:

data9 = country.population()
print(data9)

قطعه پایتون برای بدست آوردن جمعیت یک کشور خروجی زیر را تولید می کند:

جمعیت کشور

یک کشور بسته به اندازه آن ممکن است یک یا چند منطقه زمانی داشته باشد. می توانید مناطق زمانی مختلف یک کشور را با استفاده از متد API timezones() به صورت زیر واکشی کنید:

data10 = country.timezones()
print(data10)

قطعه پایتون برای بدست آوردن مناطق زمانی مختلف یک کشور خروجی زیر را تولید می کند:

منطقه زمانی کشور

6. بدست آوردن منطقه و منطقه فرعی یک کشور

منطقه کلی یا قاره ای که یک کشور به آن تعلق دارد را با استفاده از روش API region() واکشی کنید. کد را به صورت زیر پیاده کنید:

data11 = country.region()
print(data11)

قطعه پایتون برای بدست آوردن منطقه یک کشور خروجی زیر را تولید می کند:

منطقه یک کشور

به طور مشابه، می توانید منطقه خاصی را که کشور به آن تعلق دارد با استفاده از subregion() به صورت زیر انجام دهید:

data12 = country.subregion()
print(data12)

قطعه پایتون برای بدست آوردن زیر منطقه یک کشور خروجی زیر را تولید می کند:

زیرمنطقه کشور

7. دریافت URL ویکی پدیا یک کشور

ویکی پدیا یکی از بهترین منابع اطلاعاتی برای هر چیزی در اینترنت است. شما می توانید صفحه ویکی پدیا یک کشور را با استفاده از متد API، wiki() واکشی کنید. کد را به صورت زیر پیاده کنید:

data13 = country.wiki()
print(data13)

قطعه پایتون برای دریافت صفحه ویکی پدیا یک کشور خروجی زیر را تولید می کند:

صفحه ویکی کشور

8. دریافت دامنه سطح بالا برای یک کشور

ccTLD یک نام دامنه سطح بالای کد کشور است که یک کشور یا منطقه جغرافیایی وب سایت را نشان می دهد. معمولاً دو حرف مانند .in برای هند و .ca برای کانادا است. می توانید دامنه سطح بالای یک کشور را با استفاده از tld() به صورت زیر واکشی کنید:

data14 = country.tld()
print(data14)

قطعه پایتون برای دریافت دامنه سطح بالای یک کشور خروجی زیر را تولید می کند:

مطلب مرتبط:   8 میانبر صفحه کلید Eclipse برای مبتدیان ضروری است

دامنه سطح بالای کشور

9. دریافت تمام اطلاعات موجود در مورد یک کشور

شما می توانید تمام اطلاعات موجود یک کشور را با استفاده از متد API، info () واکشی کنید. یک فرهنگ لغت از مقادیر کلید/نام را برمی‌گرداند که می‌توانید با استفاده از حلقه for آن را تکرار کنید:

data15 = country.info()

for key, value in data15.items():
    print(key, ":", value)

قطعه پایتون برای دریافت تمام اطلاعات موجود در مورد یک کشور خروجی زیر را تولید می کند:

اطلاعات کشور

10. دریافت اطلاعات همه کشورها و ایجاد یک مجموعه داده

ماژول CountryInfo یک متد API به نام all() ارائه می دهد که یک فرهنگ لغت حاوی تمام اطلاعات همه کشورهای جهان را برمی گرداند:

from countryinfo import CountryInfo
import pandas as pd
country = CountryInfo()
data = country.all()

برای دستکاری این داده ها می توانید از ماژول pandas استفاده کنید. ماژول pandas دستورات زیادی را برای کار با DataFrames ارائه می دهد، از جمله یکی برای ذخیره داده ها در قالب CSV:

df = pd.DataFrame(data)
df.to_csv("Country_Data_Fetcher.csv")

واکشی داده ها از وب سایت ها

در حالی که این ماژول مفید پایتون تمام اطلاعات ضروری هر کشوری را ارائه می دهد، واکشی داده های تمیز کار آسانی نیست. دانش خراش دادن وب به شما کمک می کند تا داده ها را از هر وب سایتی در اینترنت واکشی کنید. سپس می توانید آن داده ها را در برنامه های خود تجزیه و تحلیل و استفاده کنید.

پایتون یک ماژول قدرتمند به نام BeautifulSoup دارد که می‌توانید آن را نصب کنید تا وب‌سایت را انجام داده و ساعت‌ها کار خود را ذخیره کنید.