En la era del big data, ¿qué métodos (software) se utilizan generalmente para recopilar, analizar y visualizar datos?
La recogida de datos se realiza principalmente a través de ordenadores y redes. Todos los datos procesados por las computadoras se recopilan fácilmente, como búsquedas en navegadores, clics, compras en línea, etc. Otros datos (como la temperatura, la salinidad del agua del mar, las ondas sísmicas) pueden convertirse en señales digitales a través de sensores e ingresarse en la computadora.
En términos generales, primero se deben ordenar los datos recopilados. Software de uso común: Tableau e Impress son completos, Refine y Wrangler son herramientas de clasificación de datos impuros y Weka se utiliza para la extracción de datos.
Hadoop es un marco de software que puede distribuir grandes cantidades de datos. El lenguaje R para análisis estadístico tiene una extensión R+Hadoop que puede ejecutar código R en un clúster de Hadoop. Más específicamente, búsquelo usted mismo.
Existen muchas herramientas para la producción visual. Se recomienda consultar la entrada "Visualización de datos" de Wikipedia.
Tableau e Impure tienen capacidades de visualización. El lenguaje R también puede hacer dibujos.
También hay muchos marcos o controles que se pueden utilizar para lograr resultados visuales en páginas web.
Aproximadamente se basa en cuatro tecnologías: Flash (Flex) o JS (HTML5) o Java o ASP. NET (luz plateada).
Degrafa, BirdEye, Axiis y los gráficos Flash abiertos están disponibles en Flash.
JS incluye Ajax.org, Sencha Ext JS, Filament, jQchart, Flot, Sparklines, gRaphael, TufteGraph, Exhibit, PlotKit, ExplorerCanvas, MilkChart, Google Chart API, Protovis.
Java incluye Chooseel, google-visualization-java, GWT Chronoscope, JFreeChart.
ASP.NET tiene gráficos Telerik, gráficos Visifire y Dundas.
Actualmente prefiero d3 (documento basado en datos), que tiene gráficos ricos y una gran interactividad. Puedes ir a d3js.org y echar un vistazo. Existen muchos tipos de presentaciones gráficas.