YENİ YÜZYILIN MADENCİLİĞİ:VERİ MADENCİLİĞİ

20. Yüzyılın en zengin ülkeleri, petrol yataklarına sahip ülkeler ve ticaretini yapan şirketlerken, 21. Yüzyılın petrolü; bilgi olma yolunda ilerliyor. Artık hammadde kaynağı, işgücü potansiyeli, ekonomik başarı için yeterli değil; başarı bilginin doğru yerde doğru zamanda kullanılması ve elbette kontrolünün sağlanmasıyla geliyor. Bilginin dolaşımı, paylaşılması, insani ve ekonomik kalkınmanın ve böylelikle küresel rekabet avantajının temel dinamiği haline gelmesi, yeni bir olgu olarak görünse de bunu yeni bir durum olarak görmemeliyiz. İnsan, varlığını bilgiye borçludur. Bilgi, tarih boyunca her zaman güç demekti ancak artık “bilgi devriminden” söz edilmesinin nedeni bilginin miktarı, üretimi, kullanılma, paylaşılma ve topluma yayılma oranındaki artış. Bunu sağlayan ise bilgiyi işleyen, depolayan, dağıtan teknolojilerin nicelik ve nitelik olarak eriştikleri güç.

Veri, bilgiye ulaşmada en temel kavramdır. Veri  için enformasyon ve bilginin en küçük yapı taşı da denilebilir. Veri, olaylara ilişkin nesnel  gerçeklerle ve birbirleriyle ilişkilendirilmemiştir. Veriler tek başına  işlevsizdir ve genellikle bir anlam içeriği yoktur. Önemli olan verinin hacmine takılmak  değil; veriyi analiz ederek onu bir içgörü haline getirmek, inovasyon ve işletme değerine çevirebilmektir. Fransızca kökenli bir kelime olan enformasyon, bilgilendirme demektir. Aynı zamanda düzenlenmiş veri olarak da tanımlanabilir. Düzenleme, başkası tarafından  yapılır ve o kişi için bir anlam ifade eder.

Verinin aksine enformasyon yorum içerir ve kişisel anlamda düzenlenmiş enformasyon bilgidir. Bu düzenleme, kişinin deneyimleri, görüşleri ile özümsenerek kullanıma imkan sağlayan bilgi haline gelir. Bilgi bir amaca yönelik olarak işlenmiş bir veridir ve bilgi hiyerarşisi, kendi içinde veri-enformasyon-bilgi şeklinde sıralanır.

Veri analizi, ham verileri  kullanıcıların karar vermesinde yararlı bilgilere çevirme süreci iken; bir veri hakkında daha öncelikli veri elde etme, yani veriyi tanımlayan diğer veri ise  metaveridir. Veri tabanı, birbirleriyle ilişkili olan verilerin kullanım amacına uygun olarak toplanan veriler topluluğunu; veri ambarı ise depolanmış fiziksel veriyi, bu veriye anlam kazandıran metaveriyi ve bu veriye erişebilen araçları temsil eder.

Her alanda yığınla verinin depolandığı günümüzde, veri kaynakları ve bununla orantılı olarak büyük veri de hızla artmaktadır. Bundan kaynaklı, insanlar tarafından veri yığınlarının analiz edilmesi pek mümkün olmamaktadır. Burada, bu durumun otomasyonu olarak kabul edebileceğimiz, veri madenciliği uygulamaları devreye girer.  Veriler, belli bir amaç doğrultusunda işlendiği zaman anlamlı hale gelir. Ham veriyi anlamlı hale getirme, bilgiye dönüştürülme ise  veri madenciliği ile mümkün olur.

 

Veri madenciliği için bilginin keşfi de denilebilir. Sahip olunan büyük veri kaynağının içinden farkında olunmayan, gizli kalmış bilgileri çıkarmak için kullanılan bir yöntem ve yapay zeka algoritmalarına dayanır. Veri madenciliği, günümüzde sağlıktan eğitime, hukuktan spora ve daha pek çok alanda problemin çözümünde kullanılmaktadır. Örneğin; suç analizinde veri madenciliği, suçlar arasındaki ilişkilerin ortaya çıkarılması ve analizi ile ilgili olarak kullanılabilir. Bir hastalığın teşhisi ve tedavisinde de, bir bankanın müşteri risk analizi gerçekleştirmesi, sahtekarlık analizi, e-ticaret sitelerinin ürün tavsiyesi gibi konularda da veri madenciliği uygulamalarına rastlamak mümkün. Veri madenciliği, matematiksel ve mantıksal metotlar kullanarak çok  büyük miktarda olan veriden yararlı bilgi, desen ve eğilimler ortaya çıkarmaktadır.

Veri madenciliği; büyük miktarlardaki verinin içinden geleceği tahmin edilmesinde yardımcı olacak anlamlı ve yararlı bağlantı ve kuralların, bilgisayar programları aracılığıyla aranması ve analizidir.

Internet ve bilgisayarların yaygınlaşmasıyla, sayıları gittikçe artan, milyonlarca doküman oluşmaktadır. Bu yığınlar içinde önemli bilgiler kaybolup giderken, değerli bilgilere ulaşmak için dokümanların içeriğinin belirlenmesi ve buna uygun sorgulanabilmesi ihtiyacı doğar. Veri tabanındaki veriler yapılandırılmıştır; kişi, ismi, maaşı vs kategorize olmuş, veri yapısı halinde çıkartılmıştır. Fakat metin içinde bunlar olabilmekle birlikte, bir veri yapısı söz konusu değildir ve metinin içinden bu verilerin alınıp işlenebilecek hale gelmesi gerekir. Bu da veri madenciliği uzantısı olan metin madenciliği ile mümkün olmaktadır.

Veri madenciliği sürecinde elimizde olan veri kaynakları, sadece veri tabanı olmak zorunda da değil; text, video herhangi bir veri kaynağı da olabilir. Bunların içinden kirli olanlar elenir, eksikler belirlenir. Daha sonraki aşamada ise veri ambarına geçilerek,  hedeflenen veri seçilip, üzerinde veri madenciliği algoritmaları çalıştırılarak, örüntü oluşturulur. Bu örüntülerin kullanılmasıyla da bilgi elde edilir.

Diyelim ki yaşadığınız bölgede çok fazla okul çağına gelmiş çocuk var ve buraya bir kolej açıldı. Bunu, şans eseri sizin bölgenizdeki ailelerin ihtiyacını karşılayan bir durum olarak kabul edemeyiz ve bu kolejin sahipleri de şans eseri bu bölgeye yüksek paralar harcayarak  öğrenci gelir diye açmış da olamaz; çünkü bölgedeki kırtasiyeler de, marketler de, okul çağına gelmiş çocuklar için yapılan alışverişlerdeki satış oranları, firmalar tarafından belirlenmektedir. Bu kolejin sahipleri de bu verileri satın alıp, diğer bölgelerden de aldığı verilerle değerlendirerek, sizin bölgenize kolej açmaya karar verir. Bu durum, sonuçları bilinen geçmiş verilerden yola çıkarak, sonuçları bilinmeyen verilerle elimizde olmayan zamana ve yere yönelik tahminlerde bulunmamızı sağlayan tahmin edici veri madenciliği modeline bir örnektir.

Veri madenciliği ile e-ticaret sitesinden alışveriş yaptığınızda da, sizin satın alma alışkanlıklarınız, hangi ürünleri aldığınız, ne zaman ve ne sıklıkla aldığınız veya bu ürünü alma alışkanlığınız mı değişmiş tespit edilebiliyor ve müşteri verileriniz sınıflandırılıyor. Bunun üzerine dijital stratejilerle birleştirilip, size uygun kampanya ve promosyonlardan haberdar ediliyorsunuz. Dijitalleşme ve büyük veriyle elde edilen bilgiler, yöneticilere doğru karar verebilmeleri için rehberlik ediyor ve “veriye dayalı” yönetim anlayışı her sektörde şekilleniyor.

 

Avukatlar da temel olarak bilgi ile ilgilenmektedir. Bilgi çağında bu bilgi elektroniktir. Artık kağıda dayalı araştırmaların gerektirdiği manuel girdi ihtiyacını ortadan kaldıran bir endüstri mevcut. Yığınla verinin olduğu hukuk sektöründe, veriler işlenerek daha önce bilinmeyen görüşler, sözleşme taslakları, sözleşme düzenleme hakkında sonuçlar çıkarabilir, bir hakim önünde en iyi strateji belirlenebilir, bütçelemenin ne kadar süreceği, karşı avukatın kaç kez dava açtığı, karşıt danışmanlık stratejilerinin belirlenmesi, dava açmak için en uygun zaman, hangi avukatın bu davayı kazanmak için uygun olduğu, nihai sonucu etkileyecek hareketler, geçmiş davalardan elde edilen veriler analiz edilip, bağlantılar ortaya konarak sonuçlar öngörülebilir.

Veri madenciliği, her sektörde gittikçe artan yığınla verinin işlenmesi ve organizasyonlar için doğru kararı verebilecek bilginin üretilmesi ile daha fazla rekabet avantajı, verimlilik ve şeffaflık sağlamaktadır. Geleceğin mesleklerinden biri olma yolunda ilerliyor.

Stj.Av.Şafak BULUT

KAYNAKÇA

https://insidelegal.typepad.com/files/2013/10/Big-Data-for-Law-Firms-jobst-Elster-ALA-legal-Management.pdf

Murat Levent Demircan, C.Arda Moltay,Bilgiyi Yönetmek,1.Bası 1997,Beta Yayıncılık

İsmet Barutçugil ,Bilgi Yönetimi,1.Bası 2002,Kariyer Yayıncılık

 

 

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

0