среда, 15 мая 2013 г.

GDELT: база данных о глобальных событиях c 1979 года

GDELT это новый набор данных, содержащий более 200 миллионов геопривязанных событий глобального характера с 1979 год по настоящее время. Автор Kalev Leetaru Университет Иллинойса. Данные основаны на различных международных источниках новостей и обновляются ежедневно.
Сокращенную версию набора данных, который содержит основные события, с января 1979 по июнь 2012 можно скачать по этой ссылке. Размер файла составляет около 650 Мб (файл сжат с помощью Python, вспомогательные программы и файлы сохранены в формате Unix)

Для чего нужен GDELT?
База нужна людям которые строят модели будущего, на основе фактов прошлого, как описано в статье The Effects of Intra-state Conflict on Interstate Conflict: An Analysis of GDELT

Сообщение от автора:
Ну, не могу сказать, что мы находимся на уровне LOLcats, но информация о GDELT начинает распространятся 
Вот несколько ссылок:

Телевизор Sony MKV и NTFS на HDD

Некоторые продавцы заявляют что лучше покупать корейские телевизоры,  а не телевизоры Sony, так как у них более широкая поддержка форматов файловых систем, в частности NTFS
На самом деле Sony поддерживает как FAT32, так и NTFS нужно лишь обновить прошивку с сайта пример  поддержка KDL-32EX343 
Обновление ПО TV SONY занимает 1 мин проверено на себе.

После обновления телевизор Сони читает MKV, AVI  видит NTFS, etc

Отличный инструмент для преобразования документов PDF в нормальные HTML-страницы

Конвертер pdf2htmlEX — отличный инструмент для преобразования документов PDF в нормальные HTML-страницы, с сохранением форматирования. Конвертер на удивление хорошо справляется с разными документами, включая научные статьи, журналы, формулы и прочее.
Несколько примеров в качестве демонстрации. 
Типографика (LaTeX): HTML / PDF
Шпаргалка (математически формулы): HTML / PDF
Научная статья (текст и графики): HTML / PDF
Журнал Full Circle (для Linux-сообщества): HTML / PDF
Руководство Git: HTML / PDF

Всеобщая паранойя за вами следят Skype, Google, Яндекс, FB ...

Действительно, бывшие сотрудники разведки имеют тревожную привычку полагая, что их электронная почта и телефонные разговоры контролируются - зная законы и методы сбора информации интуитивно чувствуют, что могут отказаться в поле зрения разведки.
Блоггер может быть просто блоггером, а может быть кем то другим. На основе действующего законодательства - АНБ может на законных основаниях читать электронные письма от блоггера на тему терроризма или работе спецслужб (даже если это - гражданин США), если он пишет со знанием дела о терроризме. 


Журналисты из немецкого издания Heise Security обнаружили, что компания Microsoft отслеживает приватные чаты Skype и посещает URL’ы, которую передаются в приватных чат-сессиях.

Известно, что и компания «Яндекс», и компания Google практикуют пополнение своей базы URL’ов, отслеживая все адреса, введенные в адресную строку браузера. Так что если вы введете некий только вам известный URL в браузере Chrome или в любом браузере с «Яндекс Баром», то через какое-то время этот URL может появиться и в поисковом индексе Google, и в поисковом индексе «Яндекса». Более того, компании стараются обмениваться базами новых ссылок, так что если ваш секретный URL засветился хоть где-то — скоро он появится везде.