Рубрики
 СПОНСОР
 Новости от БигМир

08 Feb 2011

 Разговор с IBM с мистер Биг данных


Разделы: Новости Интернет it

Род Смит имеет один из самых завидных названия вокруг: вице-президент по новым технологиям Интернета. Он заслужил это. Моя первая встреча с ним возвращается в первые дни SaaS (программное обеспечение как услуга), когда он был человеком точки IBM по данной теме. Но он, вероятно, самый известный за его ключевую роль в развитии WebSphere линии IBM, промежуточного, а также для его ранних пропаганда XML, веб-сервисы и J2EE.

На прошлой неделе, на следующий день после сотой годовщине IBM, я догнал Смита на конференции страты на "большой данных" - то есть, огромный шариков неструктурированных данных, созданных веб маршрутов передвижения, системы безопасности и журналов, распределенных сенсоров, грузовиков текста, и просто ни о чем другом вы можете назвать.



Теребят значение из данных когда-то считались слишком аморфное эксплойт сегодняшнюю одержимость Смита - не удивительно, так как это является одним из самых захватывающих области новых технологий. Смит приводит стратегии и планирования для большой практики IBM в данных, в том числе Большой Insights, сбор аналитики и визуализации технологии центрирования на Hadoop. Я начал наш разговор, задавая Смит о происхождении его участие в большой данных.

Эрик Knorr: Когда Вы впервые столкнулись с большой данных? Я думаю, что это было раньше она называлась, что.

Род Смит: Это было. Когда мы пошли к клиентам и говорили только об обработке данных, они все говорят, "Базы данных, мы знаем, что мы знаем о них, но есть данные, что там мы думаем, имеет значение -. Но мы не знаем, Мы считаем, что имеет идеи для нас. Но мы не хотим, чтобы забрать его и положил его в базу данных со всеми управленческих расходов, которые идут с этим, а потом найти его ничего не значит. Так что нам нужно что-то мы можем использовать для обнаружения Insights быстро -. или нет "

Это вроде как цикл разведки, но традиционной обработки данных не делает этого. Вы идете через процесс приведения его и его очистку и нормализацию его. Но они сказали: "Это не то, что мы хотим. Мы не знаем, если данные из Twitter будет ценным пока мы не увидим что-то там, что заставляет нас идти," Ага, теперь мы знаем, что мы можем сделать с ним! "

Одним из первых клиентов, которые попросили доказательство концепции BBC. Они усилия называется цифровой демократии, и они смотрели на то, как они могли бы помочь журналистам быть гораздо более эффективным Дать углубленное статей. Это займет много времени, чтобы действительно просеивать информацию. Поэтому я сказал: "Это интересно". Мы не знали, что они хотели нам сделать еще. Так они сказали: "Мы не совсем готовы, чтобы получить нашу информацию с нашей стороны, но не могли бы вы выйти и прочитать всю информацию парламентом, а затем сказать нам, что депутаты были заинтересованы в том, что счета, что счета были получать жужжали, который работал на них, как долго они работали на них? " И они дали нам список интересных вопросов. И так вот с чего мы начали, и это большой данных. Не обязательно в терабайт смысле, а в смысле дорогостоящих людей, которые пытаются работать с ней.

Кнорр: И это неструктурированные.

Смит: И это неструктурированные; или частично структурированных, так как люди называют его. Но мы, как член "большой данных", потому что данные люди были вынуждены определить различные типы данных, в отличие от деловой человек, который просто говорит: "Мне все равно, если это структурированной или неструктурированной или любой другой, я просто хочу получить эту информацию от него. И вы смешиваете меня, сказав мне, как это делается. Я не знаю, как это сделать. Мне все равно. Я просто хочу, чтобы получить эти сведения от него. " И это было действительно, как мы начали выполнения этих вещей и использования Many Eyes, в случае BBC, чтобы сделать визуализацию.






Метки: it
Рубрики: Новости Интернет it

 Комментировать



Ограничение в 1000 символов




 Счетчики