![]() | |
|
Рубрики
Последние записи
СПОНСОР
Новости от БигМир
|
08 Feb 2011
Разговор с IBM с мистер Биг данныхРазделы: Новости Интернет it Род Смит имеет один из самых завидных названия вокруг: вице-президент по новым технологиям Интернета. Он заслужил это. Моя первая встреча с ним возвращается в первые дни SaaS (программное обеспечение как услуга), когда он был человеком точки IBM по данной теме. Но он, вероятно, самый известный за его ключевую роль в развитии WebSphere линии IBM, промежуточного, а также для его ранних пропаганда XML, веб-сервисы и J2EE. На прошлой неделе, на следующий день после сотой годовщине IBM, я догнал Смита на конференции страты на "большой данных" - то есть, огромный шариков неструктурированных данных, созданных веб маршрутов передвижения, системы безопасности и журналов, распределенных сенсоров, грузовиков текста, и просто ни о чем другом вы можете назвать. Теребят значение из данных когда-то считались слишком аморфное эксплойт сегодняшнюю одержимость Смита - не удивительно, так как это является одним из самых захватывающих области новых технологий. Смит приводит стратегии и планирования для большой практики IBM в данных, в том числе Большой Insights, сбор аналитики и визуализации технологии центрирования на Hadoop. Я начал наш разговор, задавая Смит о происхождении его участие в большой данных. Эрик Knorr: Когда Вы впервые столкнулись с большой данных? Я думаю, что это было раньше она называлась, что. Род Смит: Это было. Когда мы пошли к клиентам и говорили только об обработке данных, они все говорят, "Базы данных, мы знаем, что мы знаем о них, но есть данные, что там мы думаем, имеет значение -. Но мы не знаем, Мы считаем, что имеет идеи для нас. Но мы не хотим, чтобы забрать его и положил его в базу данных со всеми управленческих расходов, которые идут с этим, а потом найти его ничего не значит. Так что нам нужно что-то мы можем использовать для обнаружения Insights быстро -. или нет " Это вроде как цикл разведки, но традиционной обработки данных не делает этого. Вы идете через процесс приведения его и его очистку и нормализацию его. Но они сказали: "Это не то, что мы хотим. Мы не знаем, если данные из Twitter будет ценным пока мы не увидим что-то там, что заставляет нас идти," Ага, теперь мы знаем, что мы можем сделать с ним! " Одним из первых клиентов, которые попросили доказательство концепции BBC. Они усилия называется цифровой демократии, и они смотрели на то, как они могли бы помочь журналистам быть гораздо более эффективным Дать углубленное статей. Это займет много времени, чтобы действительно просеивать информацию. Поэтому я сказал: "Это интересно". Мы не знали, что они хотели нам сделать еще. Так они сказали: "Мы не совсем готовы, чтобы получить нашу информацию с нашей стороны, но не могли бы вы выйти и прочитать всю информацию парламентом, а затем сказать нам, что депутаты были заинтересованы в том, что счета, что счета были получать жужжали, который работал на них, как долго они работали на них? " И они дали нам список интересных вопросов. И так вот с чего мы начали, и это большой данных. Не обязательно в терабайт смысле, а в смысле дорогостоящих людей, которые пытаются работать с ней. Кнорр: И это неструктурированные. Смит: И это неструктурированные; или частично структурированных, так как люди называют его. Но мы, как член "большой данных", потому что данные люди были вынуждены определить различные типы данных, в отличие от деловой человек, который просто говорит: "Мне все равно, если это структурированной или неструктурированной или любой другой, я просто хочу получить эту информацию от него. И вы смешиваете меня, сказав мне, как это делается. Я не знаю, как это сделать. Мне все равно. Я просто хочу, чтобы получить эти сведения от него. " И это было действительно, как мы начали выполнения этих вещей и использования Many Eyes, в случае BBC, чтобы сделать визуализацию. Метки: it Рубрики: Новости Интернет it КомментироватьСчетчики |