Etiqueta: Internet

Blogs y Power Laws (2): Un pequeño estudio

Publicado el jueves, 26 de julio de 2007 por Marcos Ros

Decíamos en el texto anterior, Blogs y Power Laws: Bienvenido a la Larga Cola, que la Larga Cola tenía un comportamiento fractal, lo que significaba que si escogíamos una pequeña sección de ésta y la estudiásemos, lo que obtendríamos sería, invariablemente, una pequeña Larga Cola. Tratando de comprobar si esto era así, lo que hemos querido realizar ha sido un experimento, localizando una Larga Cola y analizando una de sus características.

Lo analizado: El número de suscriptores de un feed de un blog

Sinceramente, nos lo hemos puesto un poco difícil porque hemos escogido como valor a estudiar el número de suscriptores que tiene un blog. Anteriormente, era bastante complicado estudiar el número de personas que podía estar apuntada a un feed, puesto que los gestores de contenido de las bitácoras generaban el código correspondiente de forma automática y no había forma de saber el número de lectores que un blog disponía a través de sus feeds ni siquiera para los autores de un blog. Sin embargo, la aparición del servicio Feedburner permitió, además de personalizar los feeds de los weblogs, añadir nuevas posibilidades a estos como las estadísticas de uso. De este modo, Feedburner permite que conozcamos el número de suscriptores mediante un pequeño código, tal como os señalamos en nuestra página de estadísticas.

Obviamente, para poder analizar el comportamiento fractal de una Larga Cola, debemos disponer de una y poder estudiar una sección de ésta. Nuestra elección ha sido el Ranking de blogs en español que es, obviamente, una Larga Cola de bitácoras – No son todas las que son, por supuesto -. El siguiente paso ha sido escoger la cabeza de la cola, los 100 primeros blogs de su ranking confiando que el resultado fuese positivo.

Debemos señalar que el cómo estructura esta página su ranking no se debe tan sólo a una sola variable, el cómo otorga los distintos pesos a las distintas variables para el establecimiento de las posiciones dentro del ranking está explicado en su FAQ, pero el valor que nosotros buscábamos el número de suscriptores a través de Feedburner se encuentra publicado en cada página personalizada de cada bitácora. Así, por ejemplo, hoy, este blog se encuentra en la posición 210 sobre un total de 4806 blogs hispanos disponiendo de distintos rankings y valores. Todos son consultables como nuestro Pagerank, los enlaces que ha detectado Technorati, el número de suscriptores de FeedBurner, así cómo el número de enlaces que el bot del sitio web ha detectado, como los datos de Google, Google Blog Search y Yahoo! Search.

Por otro lado, es cierto que no todos los blogs utilizan este servicio para ofrecer un feed estandarizado y universal, pero de las 100 bitácoras estudiadas sólo 14 no utilizaban este servicio, y algunas muy veteranas como MiniD. Nuestro interés sobre el número de suscriptores se debe a que los datos no son manipulables, es decir, en general, son personas las que deciden suscribirse a un feed, por lo que se asegura cierto número de lectores fijos sin que el autor de un blog pueda hacer mucho por aumentar o disminuir sus lectores. Es obvio que un suscriptor puede suscribirse en varias ocasiones a un mismo feed utilizando sistemas distintos, por ejemplo a través de dos lectores RSS basados en web, pero consideramos que los datos se refieren en su mayor parte a un lector por suscripción.

Seguir leyendo

5 comentarios

Blogs y Power Laws: Bienvenido a la Larga Cola

Publicado el martes, 24 de julio de 2007 por Marcos Ros

Yo acepté el caos, pero no estoy seguro
de que él me acepte a mí.
Bob Dylan

Una de las curiosidades de la Larga Cola (Long Tail) es que tiene un comportamiento fractal, es decir, si cogemos una sección de ella y la observamos, nos percataremos que es invariablemente una pequeña Larga Cola. Tomemos un ejemplo cercano: La Biblioblogosfera. Si dispusiésemos todas las bitácoras que se publican en la blogosfera y las agrupásemos por temáticas, descubriríamos sin lugar a dudas que hay una mayor cantidad de weblogs que se dedican a un tema específico muy popular, mientras que le seguirían las distintas temáticas que se distribuirían en forma de larga cola. Así, si escogiésemos una pequeña sección de esa cola, por ejemplo, las bitácoras dedicadas a la biblioteconomía y documentación, y mirásemos su temática, también descubriríamos que se organizan siguiendo una larga cola.

La Larga Cola

La Larga Cola en la Biblioblogosfera

Cuando la Biblioblogosfera estaba en su fase incipiente, todavía no había sido ni bautizada, Bárbara Flores y Elisa Legerén realizaron y publicaron un estudio que llevaba por título: El Fenómeno Weblog como nuevo medio de comunicación y su incidencia en Biblioteconomía y Documentación que analizaba la distribución de la comunidad de weblogs con temática relativa a la Biblioteconomía; de forma que establecieron un ranking de bitácoras más influyentes. Para establecer la ordenación de los sitios web, lo que sus autoras hicieron fue analizar el número de enlaces que los distintos blogs de esta temática se realizaban entre sí conformando una comunidad.

De este modo, si nos detuviésemos en analizar los gráficos que se derivaron de ese estudio descubriríamos que las cinco primeras posiciones congregan el 80% de los enlaces entrantes que se producían dentro de la comunidad de bitácoras. Siendo menos científicos, por otro lado, si consultásemos los textos y gráficos que redactamos en este mismo blog para el análisis de la biblioblogosfera también podríamos comprobar que, aproximadamente, el 20% de las bitácoras analizadas congregaban el 80% de los enlaces entrantes entre ellas (Ley de Pareto).

La ley de potencias se cumplía de una forma exacta a pesar de que, como siempre, hubo controversias de cómo se había establecido un ranking y cómo se había valorado los enlaces. Además de enfrentarnos con la realidad de que si en una pequeña comunidad de vecinos sucede que se discute sobre cómo se valora y se da peso a un blog, podemos imaginar lo que sucede a una mayor escala y de una forma más global: La blogosfera.

Seguir leyendo

5 comentarios

¿Googlepolio en búsquedas? Pues sí… A vueltas con la cuota de mercado de los buscadores

Publicado el sábado, 21 de julio de 2007 por Marcos Ros

Hace poco os comentamos que Google aparentemente nos había penalizado, para la composición de aquel texto me dispuse a hallar la cuota de mercado y, por tanto, la penetración que tenía Google en el mercado español para argumentar nuestra pérdida de visitantes. Lo cierto es que me costó encontrar un dato fiable y, de aquella búsqueda, os ofrecí una cifra inexacta pues afirmé entonces que Google disponía del 90% del mercado de búsquedas en España. Reconozco que rebajé un poco la cuota, puesto que según se afirma en el artículo Google y las cuotas de mercado el porcentaje se sitúa en un 99%.

Sinceramente, el dato me pareció un tanto escandaloso, ¿dónde quedaba la compentecia (Yahoo, MSN o Ask)? El profesor Enrique Dans en su reciente artículo ¿Es Google un monopolio? detallaba las distintas cuotas de mercado de las que dispone Google, no debemos olvidar que es su principal actividad, en el Globo:

Pero ¿es realmente Google un monopolio? En algunas de las actividades que realiza, como la búsqueda, la pregunta recibe una respuesta diferente según dónde sea planteada. Para un español, un alemán o un holandés, la respuesta es afirmativa: en los tres casos, la penetración de búsquedas hechas en Google supera el 90%. Sin embargo un chino diría que no, dado que Google representa tan solo el 21%, claramente por detrás de Baidu, el buscador dominante. En Japón, la penetración de Google es inferior a la mitad de la que posee Yahoo! En Corea del Sur, Google es prácticamente un desconocido, un competidor completamente minoritario, que sólo se utiliza en un 1.7% de las búsquedas realizadas. En el país más conectado del mundo, Google todavía lo tiene todo por hacer. Aún así, el caso de Corea del Sur, aunque preocupante y prioritario para Google, no deja de ser moderadamente anecdótico: en todo el mundo, el porcentaje de búsquedas realizadas en Google sobre el total ronda el 65%.

Hay quien cree que Google obtuvo su éxito en España, a parte de sus buenos resultados ante las distintas cadenas de búsqueda, debido a la sencillez de su interfaz (Hay que recordar que muchos utilizábamos en España una irrisoria conexión a 56 kbs en plena esfervescencia puntocom) frente a las recargadas páginas de buscadores patrios como el de Terra u Ozú. Debemos señalar que, dependiendo de los estudios a los que acudamos, la cifra puede variar hacia arriba o hacia abajo, aunque nunca descendiendo del 90% de cuota y aclarando nuestras dudas al respecto del poder de Google en la Internet hispana. Así, por ejemplo, desde Webrankinfo nos ofrecen un cuadro con los hábitos de búsqueda de los europeos por países basándose en datos de comScore:

Se afirma que la información es poder y los puntos de a través se accede a ella son importantes. Desde luego que, en España, deberíamos comenzar a plantearnos nuestro hábitos informacionales a la hora de buscar y recuperar documentación en la Red (Y en esto también debemos implicarnos los profesionales de la información) porque no sólo de Google debería de vivir el internauta.

8 comentarios

La Larga Cola (Long Tail) está llena de basura

Publicado el lunes, 16 de julio de 2007 por El Documentalista Enredado

La Larga Cola (The Long Tail) es un concepto acuñado por Chris Anderson, editor de la revista Wired, basado en las conocidas distribuciones estadísticas como, por ejemplo, la de Pareto o la ley de Zipf. En el artículo The Long Tail, publicado en Wired octubre de 2004, Anderson afirmaba, tras el análisis de datos y tendencias en los comercios digitales, que Internet y el entorno digital han cambiado las leyes de distribución y las reglas del mercado. La reducción en el coste de almacenamiento y distribución que permiten las nuevas tecnologías, hace que no sea ya necesario focalizar el negocio en unos pocos productos de éxito, en los superventas. Por lo tanto, proseguía, ahora existen dos mercados: uno centrado en el alto rendimiento de pocos productos y otro, nuevo y todavía no familiar, basado en la suma o acumulación de todas las pequeñas ventas de muchos productos, que puede igualar o superar al primero. Son el antiguo mercado de masas y el nuevo nicho de mercados, representados por la cabeza y la cola de la conocida gráfica de distribución estadística.

[…] Hace una década, la gente se quejaba de que había demasiada basura en Internet y, en efecto, una navegación al azar rápidamente lo confirmaba. Luego llegaron los motores de búsqueda para permitir que algunas señales sobresalieran del ruido, y por fin llegó Google, que utilizaba la inteligencia colectiva y ha convertido una masa incoherente en lo más parecido a un oráculo.

Esto no es exclusivo de la web, ocurre en todas partes. La ley de Sturgeon (llamada así por el autor de ciencia ficción Theodor Sturgeon) establece que "el 90 por ciento de cualquier cosa es basura". Pensemos en el arte, no desde la perspectiva de una galería sino de un mercadillo. El 90 por ciento (por lo menos) es basura. Y lo mismo se puede decir de la música, de los libros y de todo lo demás. El motivo por el cual no lo vemos así es porque la mayoría de esos bienes son filtrados por el cedazo de la distribución comercial minorista.

Seguir leyendo

3 comentarios

De Gutenberg a Internet. Una historia social de los medios de comunicación

Publicado el sábado, 7 de julio de 2007 por Marcos Ros

De Gutenberg a Internet

Según avanza la tecnología, este pequeño planeta parece estrecharse de forma acelerada, haciéndonos sentir cada vez un poco más incómodos con lo que vemos y sabemos; sintiéndonos observados y analizados de una forma continua. Y, sin embargo, qué es el ser humano sin comunicación y sin medios para ello. Desde antaño, hemos tratado de fijar el conocimiento, trasladarlo a un futuro para que pudiese ser provechoso para el desarrollo de la sociedad o para nuestros semejantes. La Historia comienza con la preservación del conocimiento, la Historia empieza con la escritura, la Historia comienza con la comunicación.

De Gutenberg a Internet: Una historia social de los medios de comunicación [ISBN: 84-306-0479-0] comienza su relato justo con la aparición de la imprenta, la técnica que serviría para la difusión de conocimientos e ideas de una forma completamente industrial. Posteriormente, pasa a detallar los profundos cambios sociales que provocaría este invento, las distintas revoluciones ideológicas que se desarrollarían al calor de ésta, que provocarían guerras y movimientos culturales que derrocarían al poder establecido, etc. Sin embargo, cuando parece que la temática a abordar son los medios de comunicación y sus soportes, los dos autores, Asa Briggs y Peter Burke, reservan otro papel para otro tipo de comunicaciones como el vapor y la electricidad, la aparición del correo, el ferrocarril, el telégrafo, el teléfono, etc.

Pasado ese tramo de la revolución industrial, el siglo XX y el XXI son un suspiro, disponiendo de un papel menos destacado, como si la revolución de la comunicación se hubiese producido mucho antes, otorgando los instrumentos para lo que vendría poco después. La televisión, la radio y el surgimiento de los medios de comunicación son tratadas con suficiencia. Internet queda como una hoja en blanco, que todavía tiene que se escrita, que se escribe en el día a día, esperando una mejor oportunidad como si no mereciese un capitulo completo sólo para ello. Y qué decir de los medios de comunicación cuyo desarrollo se ha producido en el siglo XX modificando los gustos y consumos de la sociedad, que cayeron en el descrédito en tantas ocasiones para recuperarlo; sin embargo, se pasa por ello de puntillas, como si aquello no tuviese valor.

Podría considerarse que la parte más jugosa e interesante de este libro es su primera parte, dedicada a la imprenta en la que se desgaja con estilete todo lo que ésta provocó desde un punto de vista sociológico e historiodicista. Para aquellos que se vayan a lanzar a la lectura de este libro que no crean que van a encontrar un puñado de datos e historias entrelazadas, que las hay, si no más bien un análisis de ellos.

BRIGGS, Asa; BRUKE, Peter. De Gutenberg a Internet. Una historia social de los medios de comunicación. Madrid: Taurus, 2005

Un comentario

La biblioteca 2.0: Los bibliotecarios sin Gutenberg

Publicado el lunes, 2 de julio de 2007 por Marcos Ros

La Revista Trama & Texturas es una publicación abierta e interactiva, que invita a cualquiera que lo desee y que tenga algo que decir a sumarse a ella; densa y enriquecedora en su lectura, que se apoya sobre profesionales que disponen de su propio espacio de publicación en Internet. Sus editores, José María Barandiarán y Manuel Ortuño, me invitaron hace ya un par de meses a redactar un texto para el número 2 que ya estaban preparando.

El resultado de esta experiencia, que ya relaté, fue el artículo Los bibliotecarios sin Gutenberg en el que trataba de hacer una revisión general de la situación en la que se encuentra el libro ante los retos que la Red le plantea, a la vez que situaba el papel del bibliotecario frente a esas circunstancias que se plasman en lo que se ha denominado Biblioteca 2.0.

El documento completo lo podéis encontrar en el número 2 de Trama & Texturas, sin embargo permitidme que os deje aquí uno de los apartados que más os puede llegar a interesar como profesionales de la información, además de que sirva de debate, si queréis, sobre la Biblioteca 2.0.

Actualización (3/7/2007): Nuestros amigos de la Revista Trama & Texturas hacen referencia a este texto, además de ofrecer el documento completo en PDF.

[…]

Previamente a definir lo que es la biblioteca 2.0, debemos realizar un inciso para explicar lo que es realmente la Web 2.0, puesto que un concepto deriva del otro. La web 2.0 no engloba una nueva tecnología, ni nuevas conexiones a Internet, ni es una Red alternativa; se trata de una nueva forma de interactuar las personas en la Red. La idea original de la web (en este contexto, llamada Web 1.0) consistía en páginas estáticas, escritas en el lenguaje de marcado HTML, que no eran actualizadas frecuentemente. De esta manera, el éxito de las empresas puntocom dependía en gran medida de la generación de sitios web más dinámicos donde los CMS (Sistemas de gestión de contenidos) servían páginas creadas automáticamente desde una base de datos. Frente a esto, los propulsores de la aproximación a la Web 2.0 creen que el uso de la web se está orientado a la creación e interacción de redes sociales, que pueden servir contenido de forma dinámica creando, o no, webs interactivas y visuales. Es decir, los sitios Web 2.0 actuarían más como puntos de encuentro, o webs dependientes de usuarios, que como webs tradicionales.

De esta nueva consideración de Internet como un lugar donde compartir información y experiencias en tiempo real, nace lo que se ha denominado la Biblioteca 2.0. El primer intento de definición lo realiza Michael Casey en su blog LibraryCrunch en septiembre de 2005, como podemos comprobar, en esta primera aproximación los objetivos no están claramente establecidos y por lo que queda un tanto vacía en su contenido.

Seguir leyendo

16 comentarios

Ahora que ya no nos encontráis… ¿Penalizados por Google?

Publicado el miércoles, 27 de junio de 2007 por Marcos Ros

You think you’re lovely, I know that you’re wrong.
God made me ugly, so don’t string me along.
Give me the good stuff, I’ll leave you the rest,
Send me the good stuff and I’ll put you to the test,
I’m going to

Stop messing around, cos what have you found
On the dirty ground.

Stop de I am Kloot

Hace tres años que andamos por aquí, publicando, hablando, reflexionando y tratando de comprender un poco de cómo funciona esto de la blogosfera y de Internet. Creímos que lo conocíamos un poquito todo, las escaladas de visitas, de comentarios, nuestras bajadas creativas, algunas alegrías, de gente que venía y se iba; pero durante todo este tiempo, cumplimos 1146 días en la Red, sólo nos faltaba una cosa: Que Google se olvidase de nosotros.

La situación en la que nos encontramos es nueva y extraña. Hasta ayer, crees que estás en cierta posición, que tendrás cierta audiencia todos los días, una media lo llaman, y de repente no sabes bien a santo de qué, Google decide que en realidad no vales tanto, que tus contenidos no son mejores que otros. Entonces descubres qué es volver al pasado y ser un desconocido, de nuevo.

Si este sitio web viviese de las esperanzas de ciertas ganancias derivadas de la publicidad, francamente, nos habríamos llevado las manos a la cabeza, habríamos tratado de ser buenos, revisado el sitio de arriba abajo y tratar de hacer las paces con los Googlebots y el algoritmo para que nos devolviesen a la situación en la que nos encontrábamos. Pero, no nos gusta eso, Google es al fin y al cabo un algoritmo frío, matemático y calclulador, que ha considerado que no somos lo suficiente relevantes; así que nos gusta más comentarlo y argumentarlo. Es cierto, puede que tengamos algún enlace roto, es probable que hayamos cometido el pecado de tener la información duplicada (Versión normal – Versión Texto), pero lo cierto es que no hemos cometido ningún pecado nuevo, seremos reincidentes, mas no nos merecemos el purgatorio o el Sandbox de Google.

Desenchufados a las 10 de la noche

Nuestras estadísticas son públicas, así que sabréis que el 80% de nuestras visitas provienen de los resultados que genera Google ante una cadena de búsqueda. Esto no es de extrañar, ya que el buscador posee el 90% del mercado en España, así que deja poco margen para la competencia. Si el 80% de nuestras visitas provienen de Google, es sencillo detectar cuándo se produjo su cambio de consideración del buscador respecto a nosotros. Comprobamos nuestras estadísticas y las cosas nos marcharon bien hasta ayer, 26 de junio, a las 22h que se produjo un bajón considerable en nuestros visitantes.

Si comparamos las estadísticas de ayer con las de hoy, comprobaréis que la escabechina ha sido realmente importante disponiendo hoy de sólo el 33% del tráfico que tuvimos ayer.

Penalizaciones en Google

No somos los primeros ni vamos a ser los últimos, pero obviamente no podemos hacer otra cosa que esperar a que las cosas se vayan arreglando y poniendo en su sitio. Nuestro Pagerank sigue siendo el que era, es decir 5, y no creemos que debamos tener razones para que la situación varíe, puesto que no hemos realizado ningún cambio en la web ni ninguna acción para mejorar nuestra valoración. Por lo tanto, seguiremos tal y como estamos, esperando que esto dure una semana y no un mes y que en breve se solucione.

Actualización (29/6/2007) – Aparentemente, las cosas han vuelto a la normalidad y volvemos a estar en las posiciones en las que nos encontrábamos antes del incidente. Gracias a todos por vuestro interés en nuestros desvelos.

20 comentarios