viernes, 25 de agosto de 2017

Retropost #1759 (25 de agosto de 2007): Datos sobre comentarios

Datos sobre comentarios

Publicado en Blogs. com. José Ángel García Landa

Me he leído un análisis sobre comentarios en los blogs que aporta ciertos datos estadísticos interesantes, además de otras reflexiones menos cuantitatificadas. Es un artículo presentado en 2006 por Gilad Mishne y Natalie Glance, "Leave a Reply: An Analysis of Weblog Comments" (PDF) - vía Reflexiones e Irreflexiones.

Los autores se plantean estudiar esta parte un tanto descuidada de la blogosfera: después de todo, un blog suele definirse como un texto en red donde aparte del autor o autores pueden escribir, de manera más subordinada o comentativa, otras personas, añadiendo comentarios - personas que por tanto también son coautores del blog en conjunto, si bien no de los artículos. Estiman Mishne&Glance que la "comentosfera" supone cerca de un tercio del volumen de la blogosfera, una parte descuidada en los estudios, como en la tecnología: en general no se sindican los comentarios: sólo cerca del 2% de la comentosfera lo estaba (en 2005).

El análisis se basa en un corpus de unos 645.000 comentarios (todos de 2005), impresionante. No entraré a discutir la manera en que obtienen los datos, aunque como es de suponer la búsqueda automatizada tiene tantas virtudes como inconvenientes: cuadricula mucho lo que se puede buscar, y a veces se eliminan bloques enormes de datos en principio relevantes porque no cuadran con el método empleado, como eliminar todo Livejournal, o todos los posts sin enlaces permanentes. Gajes. Pero hay que darlo por bueno:  Datos principales aportados por Mishne&Glance:

- 685.976 posts analizados, con 645.042 comentarios - a 0'9 comentarios por post, aunque como veremos esto no funciona por términos medios. Sólo el 15% de los posts tienen comentarios. De los comentados, el número medio de comentarios es de 6'3, la mediana 2, y la desviación media 20'5.
- Algunos datos sorprenden, y hasta duda uno de su exactitud. Por ejemplo, el número de blogs sin ningún comentario: el 78 %. Y eso que han eliminado blogs inactivos, o falsos, o blogs de un solo post para el análisis. Esa es otra: estos pseudo-blogs o neonatos muertos son una parte importante de todos los supuestos millones de blogs  (más de 56 millones hoy según Blogpulse). Admiten los autores que su corpus sólo contiene cerca de una cuarta parte de los comentarios correspondientes a su corpus de blogs. Con lo cual, hay que relativizar...
- Media de palabras por post: 63; mediana, 31; desviación: 93.The Long Tail

Aunque no presentan los gráficos con la forma típica de cola larga, así hay que verlos: "un pequeño número de posts [y de blogs] con un gran numero de comentarios y una larga cola de posts [y de blogs] con pocos comentarios [o ninguno]". Y otro gráfico de larga cola para la longitud de los comentarios: pocos extraordinariamente largos, pocos largos, muchos cortos.

Y lo mismo se aplica sin duda a la relación entre cantidad de texto y número de comentarios, o a otras dimensiones no tenidas en cuenta en este estudio, como la presencia relativa de comentaristas específicos o su índice de retorno, así como a la relación entre actividad lectora y actividad comentarística: muchos lectores silenciosos o comentadores ocasionales (la larga cola) con pocos de ellos proporcionando altos índices de comentarios. Pero como digo, estas dimensiones no entran en este estudio.

Otras conclusiones no sorprendentes: que los comentarios aportan contenido, que ayudan a la localización temática automatizada de un artículo por palabras clave, que ayudan a medir la relevancia de un post... Que los blogs más enlazados y más visitados son también más comentados... y otras inevitabilidades estadísticas. Con las excepciones que señalan los autores: al usarse con relativa frecuencia la opción de desactivar comentarios, también hay blogs relevantes con pocos comentarios o sin ellos. También se apunta la razón del caso contrario, blogs poco enlazados y poco relevantes pero muy comentados—en el caso de pequeños grupos que utilizan los comentarios como si fueran un chat (con lo cual dejan de ser comentarios al post, y hasta a su tema). Usos diversos para la misma cosa.

Me ha interesado el intento de cuantificar automáticamente las disputas, desacuerdos o desavenencias en los comentarios. La mayoría de los comentarios son "consonantes" con el autor o con otros comentaristas, pero un 16% de los comentarios son disonantes o "disputative" (y un 21% de las series de comentarios). Los asuntos que más se prestan a desavenencias son los políticos, religiosos e ideológicos.

La manera de captar las frases que indican actitud subjetiva fue comparar el corpus de entradas de la Wikipedia con el corpus de comentarios de usuarios en la misma.  Claro que habrá comentarios (por ejemplo muchos míos) que muestran desacuerdo sin usar frases con alto nivel de subjetividad. Y, por otra parte, la diferencia entre el acuerdo y el desacuerdo es un continuo. No obstante, el método seguido aquí parece adecuado para analizar grandes masas de datos a grandes rasgos, for what it's worth (a mí me va más, y estoy mejor equipado para, el microanálisis de matices). Otros datos: los comentarios disputativos tienden a ser más largos y a aparecer en series de comentarios más largas. No observan los autores el retorno de los comentadores disputativos a la discusión, pero también obviamente hay más interacción sostenida en torno a una disputa que en torno a un acuerdo.

Autoevaluación a la luz de estos datos: Que mis posts son larguísimos, mi relación entre cantidad de texto del artículo y comentarios recibidos es atroz, y va a peor, que estoy en la larga cola de blogs no comentados o poco comentados. Poco comentado, incluso, en relación al número de visitas... aunque a base de perseverancia y muchos posts sí tengo más comentarios, en términos absolutos, que muchos que le dedican menos tiempo y esfuerzo. Y que si bien antes tenía comentarios con desavenencias, han ido desapareciendo, para dejarme hablar solo en una amplia llanura de silencio, en la que puedo largar a gusto lo que tenga que decir, sin que valga la pena ponerse a discutir conmigo. Lo bueno del caso es que no se puede uno sentir solo, entre tantos blogs sin comentario.


Etiquetas: ,



—oOo—

No hay comentarios:

Publicar un comentario

Se aceptan opiniones alternativas, e incluso coincidentes: