büyük veri (big data) nedir?

Veri nedir?

Büyük veri (Big Data) Nedir? Veri, metin, gözlemler, şekiller, semboller ve nesnelerin açıklamaları vb. gibi ham, örgütlenmemiş gerçekler ve ayrıntılar topluluğudur. Başka bir deyişle, verilerin belirli bir amacı yoktur ve kendi başına bir önemi yoktur. Ayrıca veriler, bilgisayar depolama ve işleme bağlamında temel bilgi birimleri olan bit ve bayt cinsinden ölçülür.

Bilgi nedir?

Bilgi işlenir, organize edilir ve yapılandırılır. Veriler için bağlam sağlar ve karar vermeyi sağlar. Veri bilginin ham halidir.

Büyük Veri (Big Data) nedir?

Büyük veri, geleneksel yöntemlerle işlenmesi zor veya imkansız olan çok büyük, hızlı veya karmaşık verileri ifade eder. Diskte çok büyük yer kaplar.Ancak bu büyük hacimli veriler, daha önce çözemeyeceğiniz iş sorunlarını çözmek için kullanılabilir.

Büyük Veri (Big Data) Türleri

Büyük Veri türleri şunlardır:

  1. Yapılandırılmış
  2. Yapılandırılmamış
  3. Yarı yapılandırılmış

Yapılandırılmış

Sabit formatta saklanabilen, erişilebilen ve işlenebilen her türlü veri, ‘yapılandırılmış’ veri olarak adlandırılır.

Zaman içinde, bilgisayar bilimlerindeki yetenekler, bu tür verilerle çalışmak için teknikler geliştirdi ve ayrıca bundan değer elde etmede daha büyük başarılar elde etti. 

Yapılandırılmamış

Bilinmeyen form veya yapıya sahip herhangi bir veri, yapılandırılmamış veri olarak sınıflandırılır. Boyutlarının çok büyük olmasına ek olarak, yapılandırılmamış veriler, ondan değer elde etmek için işlenmesi açısından birçok zorluk doğurur. Yapılandırılmamış verilere tipik bir örnek, faturalar, ödemeler, e-devlet verileri vs…

Yarı Yapılandırılmış

Yarı yapılandırılmış veriler, her iki veri biçimini de içerebilir. Yarı yapılandırılmış verileri formda yapılandırılmış olarak görebiliriz, ancak aslında ilişkisel VTYS’de örneğin bir tablo tanımı ile tanımlanmaz . Yarı yapılandırılmış veri örneği, bir XML dosyasında temsil edilen bir veridir.

Büyük Verinin Özellikleri

1. Variety (çeşitlilik)

Çeşitlilik, hem yapılandırılmış hem de yapılandırılmamış heterojen kaynaklara ve verilerin doğasına atıfta bulunur. Günümüzde e-posta, fotoğraf, video, izleme cihazları, PDF’ler, ses vb. şeklindeki verilerde analiz uygulamalarında dikkate alınmaktadır. Bu yapılandırılmamış veri çeşitliliği, verilerin depolanması, madenciliği ve analizi için belirli sorunlar doğurur.

2. Velocity (hız)

Veri oluşturma hızını ifade eder. Verilerin talepleri karşılamak için ne kadar hızlı üretildiği ve işlendiği, verilerdeki gerçek potansiyeli belirler.

Büyük Veri Hızı, iş süreçleri, uygulama günlükleri, ağlar ve sosyal medya siteleri, sensörler, Mobil cihazlar vb. kaynaklardan gelen verilerin akış hızıyla ilgilenir . Veri akışı çok büyük ve süreklidir.

3. volume (veri büyüklüğü)

Verinin boyutu, verinin değerini belirlemede çok önemli bir rol oynar. Ayrıca, belirli bir verinin gerçekten Büyük Veri olarak kabul edilip edilemeyeceği, veri hacmine bağlıdır. Bu nedenle,  ‘Hacim’  , Büyük Veri çözümleriyle uğraşırken dikkate alınması gereken bir özelliktir.

4. Verification (doğrulama)/ veracity (gerçeklik)

Oluşan bu bilgi yoğunluğu içerisinde verinin ‘güvenli’ olması son derece önemlidir. Verinin güvenliği açısından, akış esnasında doğru katmanda ve olması gereken güvenlik seviyesinde izlenmesi gerekiyor. Güvenlik açısından doğru kişiler tarafından görülebilir olmalı ya da gizli kalması gerekir.

Büyük Verini Sektöre Katkıları

Finans

Finans ve sigorta endüstrileri, diğer kullanımların yanı sıra dolandırıcılık tespiti, risk değerlendirmeleri, kredi sıralamaları, aracılık hizmetleri ve blok zinciri teknolojisi için büyük veri ve tahmine dayalı analitiği kullanır.

Finansal kurumlar ayrıca siber güvenlik çabalarını geliştirmek ve müşteriler için finansal kararları kişiselleştirmek için de büyük verileri kullanır.

Sağlık hizmeti

Hastaneler, araştırmacılar ve ilaç şirketleri, sağlık hizmetlerini iyileştirmek ve ilerletmek için büyük veri çözümlerini benimsiyor.

Çok büyük miktarda hasta ve nüfus verilerine erişimle sağlık hizmetleri, tedavileri iyileştiriyor, kanser ve Alzheimer gibi hastalıklar üzerinde daha etkili araştırmalar yapıyor, yeni ilaçlar geliştiriyor ve nüfus sağlığı içindeki kalıplar hakkında kritik içgörüler kazanıyor.

Medya ve Eğlence

Daha önce Netflix, Hulu veya öneriler sunan diğer akış hizmetlerini kullandıysanız, işte büyük verilere tanık oldunuz. 

Medya şirketleri, kişiselleştirilmiş deneyimler oluşturmak için okuma, izleme ve dinleme alışkanlıklarımızı analiz eder. Netflix, müşteri tercihleriyle ilgili kararlar almak için grafikler, başlıklar ve renkler hakkındaki verileri bile kullanır .

Dolandırıcılık ve Uyumluluk

Güvenlik söz konusu olduğunda, sadece birkaç haydut bilgisayar korsanı değil, tüm uzman ekiplere karşısınız. Güvenlik ortamları ve uyumluluk gereksinimleri sürekli olarak gelişmektedir. Büyük veri, düzenleyici raporlamayı çok daha hızlı hale getirmek için verilerdeki sahtekarlığı gösteren kalıpları belirlemenize ve büyük hacimli bilgileri toplamanıza yardımcı olur.

Diğer uygulama alanları:

Büyük veri avantajları:

  • Büyük veri, daha fazla bilgiye sahip olduğunuz için daha eksiksiz cevaplar almanızı mümkün kılar.
  • Daha eksiksiz cevaplar, verilere daha fazla güven anlamına gelir; bu da sorunların üstesinden gelmek için tamamen farklı bir yaklaşım anlamına gelir.

Big data ile işlenmesi çok zor olan bu veri  büyük boyutlara ulaşınca bilgi çöplüğü kavramı ortaya çıktı.

Bilgi Çöplüğü nedir?

Yıllar boyunca artan veri ilişkisel veri tabanlarında saklanamaz boyuta ulaştı.

  • Sosyal medya paylaşımları 
  • Bloglar
  • Alışveriş bilgileri
  • Fotoğraflar, videolar, log files, vs…

Veri tabanlarında saklanamamasından ötürü bu veriler işlenemez ve sınıflandırılamaz bir  hal aldı.

Nesnelerin İnterneti (IoT) 

Büyük veri ve IoT birlikte çalışır. IoT cihazlarından çıkarılan veriler, cihazlar arası bağlantının bir haritasını sağlar. Bu tür eşleştirmeler medya endüstrisi, şirketler ve hükümetler tarafından hedef kitlelerini daha doğru bir şekilde hedeflemek ve medya verimliliğini artırmak için kullanılmıştır. IoT ayrıca duyusal veri toplama aracı olarak giderek daha fazla benimseniyor ve bu duyusal veriler tıbbi, imalat ve ulaşım bağlamlarında kullanılıyor.

Leave a Comment