Karakter veri tipleri ve yaygın sorunlar

SQL ile Keşifsel Veri Analizi

Christina Maimone

Data Scientist

PostgreSQL karakter tipleri

character(n) veya char(n)

  • sabit uzunluk n
  • karşılaştırmalarda sonda boşluklar yok sayılır

character varying(n) veya varchar(n)

  • azami n'e kadar değişken uzunluk

text veya varchar

  • sınırsız uzunluk
SQL ile Keşifsel Veri Analizi

Metin veri türleri

Kategorik

Tues, Tuesday, Mon, TH

shirts, shoes, hats, pants

satisfied, very satisfied, unsatisfied

0349-938, 1254-001, 5477-651

red, blue, green, yellow

Yapısız metin

I really like this product. I use it every day. It's my favorite color.

We've redesigned your favorite t-shirt to make it even better. You'll love...

Four score and seven years ago our fathers brought forth on this continent, a new nation, conceived in Liberty, and dedicated to the proposition that all men are created equal...

SQL ile Keşifsel Veri Analizi

Gruplama ve sayma

SELECT category,        -- kategorik değişken

       count(*)         -- her kategori için satır sayısı

  FROM product          -- tablo

 GROUP BY category;     -- kategorik değişken


 category | count 
----------+-------
 Banana   |     1
 Apple    |     4
 apple    |     2
  apple   |     1
 banana   |     3
(5 rows)
SQL ile Keşifsel Veri Analizi

Sıra: en sık değerler

SELECT category,        -- kategorik değişken

       count(*)         -- her kategori için satır sayısı

  FROM product          -- tablo

 GROUP BY category      -- kategorik değişken

 ORDER BY count DESC;   -- en sık değerleri önde göster
 category | count 
----------+-------
 Apple    |     4
 banana   |     3
 apple    |     2
 Banana   |     1
  apple   |     1
(5 rows)
SQL ile Keşifsel Veri Analizi

Sıra: kategori değeri

SELECT category,        -- kategorik değişken

       count(*)         -- her kategori için satır sayısı

  FROM product          -- tablo

 GROUP BY category      -- kategorik değişken

 ORDER BY category;     -- kategoriye göre sırala
 category | count 
----------+-------
  apple   |     1
 Apple    |     4
 Banana   |     1
 apple    |     2
 banana   |     3
(5 rows)

SQL ile Keşifsel Veri Analizi

Alfabetik sıra

-- Sonuçlar

 category | count 
----------+-------
  apple   |     1
 Apple    |     4
 Banana   |     1
 apple    |     2
 banana   |     3
(5 rows)

-- Alfabetik sıra:

' ' < 'A' < 'a'
-- Sonuçlardan

' ' < 'A' < 'B' < 'a' < 'b'

SQL ile Keşifsel Veri Analizi

Yaygın sorunlar

Büyük/küçük harf fark eder

    'apple' != 'Apple'

 

Boşluklar sayılır

    ' apple' != 'apple'

    '' != '       '

Boş dizgiler null değildir

    '' != NULL

 

Noktalama farklılıkları

    'to-do' != 'to–do'

SQL ile Keşifsel Veri Analizi

Metin verilerini inceleme zamanı

SQL ile Keşifsel Veri Analizi

Preparing Video For Download...