Twitter, bildiğiniz üzere insanların düşüncelerini paylaştıkları bir platformdur. Gerek siyasi konular, gerekse futbol muhabbetleri hakkında insanlar düşüncelerini mikroblog olarak değerlendirdiğimiz Twitter üzerinden paylaşmaktadır.
Bu paylaşılan veriler ise, bizim için analiz edilebilir, toplulukların konulara verdiği tepkileri toparlayarak genelleme yapılabilir bir durum ortaya çıkartmaktadır. Açık Kaynak İstihbaratı dediğimizde şey de zaten, paylaşılmış büyük veriler üzerinden bilgi elde edebilmek değil miydi?
Bu analizleri yaparken kullanabileceğimiz bazı araçlar mevcut. Bu araçların başında, açık kaynak kodlu olarak dağıtımı yapılan Tinfoleak isimli bir istihbarat aracı mevcuttur. Verdiğimiz kullanıcı adına bağlı olarak, o twitter hesabının bir çok analizini otomatik olarak yapmaktadır.Tinfoleak’i linux veya windows işletim sistemi üzerinde çalıştırabilir ve deneyebilirsiniz. Bu uygulama, en yaygın twitter istihbarat analizi uygulamasıdır.
Twitter analizi yapan Tinfoleak ile, hesap bilgisi, kullanıcı etkinliği, kaynak uygulamalar, kullanıcı cihazları, hashtagler, mentionlar, metin analizi, kelime frekansları, medyalar, meta verileri, kullanıcının ziyaret ettiği yerler, kullanıcı rotaları, sosyal ağlar, coğrafi etiketler, takipçiler, arkadaşlar, konuşmalar, listeler, koleksiyonlar gibi bir çok veri elde edilebilir. Ve bunların tamamı, paylaşımlardan çıkartılan basit sonuçlarla elde edilebilir.
Bunların yanı sıra, siyasi görüş, dini, etnik kökeni, memleketi, inancı, mezhebi, iş yeri, hobileri, mesleği gibi bir çok konu da detay inceleme ile elde edilebilir.
Tinfoleak’in Kurulumu
Linux’ta öncelikle python’un kurulması gerekmektedir.
sudo apt install python-pip python-dev build-essential python2.7-dev python-pyexiv2 python-openssl
sudo pip install — upgrade pip
sudo pip install — upgrade virtualenv
sudo pip install — upgrade tweepy
sudo pip install — upgrade pillow
sudo pip install — upgrade exifread
sudo pip install — upgrade jinja2
sudo pip install — upgrade oauth2
Bu işlemi bitirdikten sonra “https://github.com/vaguileradiaz/tinfoleak” adresini kopyalıyoruz.Ve kurulum yapıyoruz. Kurulum için;
git clone https://github.com/vaguileradiaz/tinfoleak.git
komutunu çalıştırıyoruz.

nano tinfoleak.conf
CONSUMER_KEY
CONSUMER_SECRET
ACCESS_TOKEN
ACCESS_TOKEN_SECRET
python tinfoleak.py
Aslında bu bilgilerin tamamı Twitter API’leri üzerinden de alınabilmektedir. Tinfoleak’de aynı yöntemle bağlanıp aynı verileri alıyor. Fakat kod yazmadan, API’lerle uğraşmadan tek bir kurulumla tüm verilere aynı anda ulaşmamızı kolaylaştırmaktadır.
Bunların yanı sıra, tinfoleak ile gelen dataları farklı bir platforma taşıyarak analiz etmek çok daha faydalı olacaktır.
Twitter’da profili açık kişiler üzerinden;
Twitter’a giriş yaptığı zaman, lokasyonu, zaman durumu gibi genel nitelikli veriler bulunmaktadır. Bunların yanı sıra, kullanıcının kaç twit attığı, kaç kişiyi takip ettiği, kaç kişi tarafından takip edildiği, takip edilen / takipçi oranı gibi bilgilere ulaşmak mümkündür.
Bunların yanı sıra,
Kullandığı kelimelerin analizi, etiketlerin analizi, mentionlaştığı kişilerin analizi gibi bilgiler de bulunmaktadır. Kullanıcıların sahte olup olmadığını analiz etmek için kaç twitinin yanıtlandığı, kaç twiti yanıtladığı, kaç twitin retiwit edildiği, kaç twitinde medya bulunduğu, kaç twitinde link bulunduğu gibi bir çok detaya ulaşmak mümkündür. Ayrıca twitleri genelde hangi saatler içinde attığı gibi bilgilere de ulaşmak mümkündür.
Bu bilgilerle, veri analizi yapılacağı zaman kullanıcıların gerçeklik tespiti yapılabilmektedir. Tüm twitlerinde medya barındıran veya link barındıran hesaplar muhtemel reklam hesaplarıdır ve dikkate alınmamalıdır. Tüm twitleri başkalarının twitlerini RT etmiş olan hesaplar da muhtemelen başkaları tarafından RT paketi olarak alınmış bot hesaplarıdır. Bunlar da veri analizinde dikkate alınmamalıdır. Kullanılan kelimeleri tamamen sözlükler, deyimler, atasözleri gibi olan hesaplar da otomatik hesap olarak değerlendirilir ve veri analizinde dikkate alınmamaktadır. Kendisinin takip ettiği hesap sayısı ile takip edilen hesap sayısı oranı çok düşük olan hesaplar da dikkate alınmamaktadır. 5 bin kişiyi takip eden bir hesabı, 10 kişi takip ediyorsa, muhtemel bir bot hesabı olduğundan veri analizinde bu da dikkate alınmamaktadır. Bu hesapları tek tek incelemek zor olduğundan, bunların tüm verilerinin bir veritabanında tutulması ve analiz sonrasında gerekli verilerin elenmesi çok daha mantıklı olacaktır.
Burada genel görünümde var olan verilerin belirli frekansı çıkartılarak, üstünde kalan hesaplar dikkate alınabilmektedir.
Basit sorgularla, işe yarayacak veya veri analizinde dikkate alınmayacak hesaplar çıkartılabilmektedir.