Veri Bilimi İçin Ralli Maratonu Etap — 21.ipynb

Bekir Öndeş
4 min readJan 1, 2022

--

Python Kütüphanelerine Giriş — Pandas — 2

Pandas kütüphanesi ile kaldığımız yerden devam ediyoruz. Veri çerçevesinden bahsedelim.

Data Frame:

İki boyutlu, boyutu değişebilir, potansiyel olarak farklı veri tiplerini barındıran tablo verileridir. Hemen yapısına bir bakalım.

Data Frame Yapısı

Görsele baktığımızda önceden öğrendiğimiz parametreler bulunmaktadır. Seriler yapısına ek ekstra columns parametresi geldi. Hemen bu parametreye odaklanalım.

columns: Alınan veri için sütun isimlendirilmesi yapılmasını istersek, kullanacağımız parametre columns parametresi olacaktır.

Hemen bir örnek yapalım.

Data Frame Örneği

Hem bir data frame örneğinin hem de data frame parametresi olan columns kullanımını görüyoruz.

Serilerde kullandığımız dictionary veri tipini data frame yapısında da kullanalım.

Data Frame Örneği — 2

dictionary veri tipi ile data frame oluştururken index parametresi kullandığımıza dikkat ediniz. Peki neden kullandık?

dictionary veri tipi kullanıp bu veri tipini data frame olarak yapılandırmak istedik ve bizim data frame veri yapımız iki boyutlu olduğu için veri yapısına uygun bir uzunluk belirttik . Bu uzunluğu belirtmediğimiz takdirde hata ile karşılaşacaktık.

dtypes Gösterimi

Görsele baktığımızda oluşturduğum bir data frame yapısında verilerimizin hangi veri tipi olduğunu dtypes anahtar sözcüğü ile öğrendik.

Artık NumPy kütüphanesini öğrendiğimize göre ve verileri artık tek tek elle yazmayacağız anlamına geliyor. Projemize NumPy kütüphanesini dahil edelim ve basit bir dizi oluşturup data frame ile işlemlerimi yapalım.

Data Frame oluşturmak

Artık elimizde bir data frame var. Bu data frame ile yapabileceğimiz bazı metotları görelim.

head():

head() Kullanımı

head() metodu, oluşturduğumuz veriden; ilk beş veriyi göstermemizi sağlar.

tail():

tail() metodu, oluşturduğumuz veriden; son beş veriyi göstermemizi sağlar.

tail() Kullanımı

Görsellere baktığımızda oluşturduğumuz data frame verisini data_frame değişkenine atadığımızı gözlemlemekteyiz. Şimdi ise data_frame değişkeni için kullanabileceğimiz bazı anahtar sözcükler var.Bunlar; index ve column anahtar sözcüğüdür.

index ve column Kullanımı

data_frame.index = Oluşturduğumuz veride, index kısmında yer alan verileri gösterir.

data_frame.column= Oluşturduğumuz veride, sütun kısmında yer alan verileri gösterir.

Oluşturduğumuz data_frame değişkeni için istatistiksel bir özete bakmak için kullanacağımız describe() metodu mevcuttur.

describe():

Hemen data_frame değişkeninin istatistiksel özetine bir bakalım.

describe() Kullanımı

count : Oluşturduğumuz verinin, kaç adet satırdan oluştuğunu gösterir.

mean : Oluşturduğumuz verinin, her bir sütunun ortalamasını gösterir.

std : Oluşturduğumuz verinin, her bir sütunun standart sapmasını gösterir.

min : Oluşturduğumuz verinin, her bir sütununda yer alan en küçük değeri gösterir.

→ 25% : Oluşturduğumuz verinin, her sütununda yer alan değerlerin yüzde yirmi beşi (25%) gösterilen değere eşit veya daha azdır.

→ 50% : Oluşturduğumuz verinin, her sütununda yer alan değerlerin yüzde ellisi (50%) gösterilen değere eşit veya daha azdır. Ayrıca median değerine eşittir.

→ 75% : Oluşturduğumuz verinin, her sütununda yer alan değerlerin yüzde yetmiş beşi (75%) gösterilen değere eşit veya daha azdır.

max : Oluşturduğumuz verinin, her bir sütununda yer alan en büyük değeri gösterir.

Şimdi ise sıralama metodunu görelim ve axis değerine göre verilerimizi sıralayalım.

sort_index():

Belirteceğimiz bir axis değerine göre tersine çeviren bir metot olarak kullanabiliriz.

sort_index() Kullanımı

sort_index() metodunu kullanırken ascending parametresini kullandım. Bu parametrenin amacı ise yapacağımız sıralama işlemini gerçekleştirmek.

ascending : Türkçe tanımına baktığımızda artan olarak gelmektedir.

Bu tanıma uygun olarak ascending değerimizi False yaptık. Varsayılan olarak değerlerimiz artıyor yani ascending değerimiz True olarak gelmektedir. Bu yüzden ascending=False yapıp sıralama işlemini gerçekleştirdik.

Yazımızı bitirmeden önce sıralama işlemini sütun olarak ta gösterip yazımızı sonlandıralım. Bunun için kullanacağımız metot sort_values() metodu olacaktır.

sort_values() Kullanımı

Bu yazımızda data frame veri yapısından bahsettik. İşimizi kolaylaştıracak bazı metotlara değindik.

Bir diğer yazımızda görüşmek üzere.

--

--