Basit rastgele ve sistematik örnekleme

Python'da Örnekleme

James Chapman

Curriculum Manager, DataCamp

Basit rastgele örnekleme

Bir piyango kavanozundan katlanmış kağıt çeken bir el.

Yuvarlanan piyango topları.

Python'da Örnekleme

Kahvelerin basit rastgele örneklenmesi

Satır ve sütunlar halinde dizilmiş kahve çekirdekleri.

Satır ve sütunlar halinde dizilmiş, bazılarının grileştirildiği kahve çekirdekleri.

Python'da Örnekleme

pandas ile basit rastgele örnekleme

coffee_ratings.sample(n=5, random_state=19000113)
     total_cup_points         variety country_of_origin  aroma  flavor  \
437             83.25            None          Colombia   7.92    7.75   
285             83.83  Yellow Bourbon            Brazil   7.92    7.50   
784             82.08            None          Colombia   7.50    7.42   
648             82.58         Caturra          Colombia   7.58    7.50   
155             84.58         Caturra          Colombia   7.42    7.67  

     aftertaste  body  balance  
437        7.25  7.83     7.58  
285        7.33  8.17     7.50  
784        7.42  7.67     7.42  
648        7.42  7.67     7.42  
155        7.75  8.08     7.83 
Python'da Örnekleme

Sistematik örnekleme

Satır ve sütunlar halinde dizilmiş kahve çekirdekleri.

Satır ve sütunlar halinde dizilmiş, çapraz bir çizgi üzerindekiler dışında çoğu grileştirilmiş kahve çekirdekleri.

Python'da Örnekleme

Sistematik örnekleme - aralığı tanımlama

sample_size = 5

pop_size = len(coffee_ratings)
print(pop_size)
1338
interval = pop_size // sample_size

print(interval)
267
Python'da Örnekleme

Sistematik örnekleme - satır seçimi

coffee_ratings.iloc[::interval]
      total_cup_points  variety country_of_origin  aroma  flavor  aftertaste  \
0                90.58     None          Ethiopia   8.67    8.83        8.67   
267              83.92     None          Colombia   7.83    7.75        7.58   
534              82.92  Bourbon       El Salvador   7.50    7.50        7.75   
801              82.00   Typica            Taiwan   7.33    7.50        7.17   
1068             80.50    Other            Taiwan   7.17    7.17        7.17   

      body  balance  
0     8.50     8.42  
267   7.75     7.75  
534   7.92     7.83  
801   7.50     7.33  
1068  7.17     7.25  
Python'da Örnekleme

Sistematik örneklemenin sorunu

coffee_ratings_with_id = coffee_ratings.reset_index()
coffee_ratings_with_id.plot(x="index", y="aftertaste", kind="scatter")
plt.show()

Artçı tat puanları ile indekslerin saçılım grafiği.

Bu saçılım grafiğinde bir desen görmüyorsak sistematik örnekleme güvenlidir

Python'da Örnekleme

Sistematik örneklemeyi güvenli kılma

shuffled = coffee_ratings.sample(frac=1)

shuffled = shuffled.reset_index(drop=True).reset_index()
shuffled.plot(x="index", y="aftertaste", kind="scatter") plt.show()

Veri kümesi karıştırıldıktan sonra artçı tat puanları ile indekslerin saçılım grafiği.

Satırları karıştırma + sistematik örnekleme, basit rastgele örnekleme ile aynıdır

Python'da Örnekleme

Hadi pratik yapalım!

Python'da Örnekleme

Preparing Video For Download...