Datos sobre comentarios
Publicado en Blogs. com. José Ángel García Landa
Me he leído un análisis sobre comentarios en los blogs que aporta
ciertos datos estadísticos interesantes, además de otras reflexiones
menos cuantitatificadas. Es un artículo presentado en 2006 por Gilad
Mishne y Natalie Glance, "Leave a Reply: An Analysis of Weblog Comments"
(PDF) - vía Reflexiones e Irreflexiones.
Los autores se plantean estudiar esta parte un tanto descuidada de
la blogosfera: después de todo, un blog suele definirse como un texto en
red donde aparte del autor o autores pueden escribir, de manera más
subordinada o comentativa, otras personas, añadiendo comentarios -
personas que por tanto también son coautores del blog en conjunto, si
bien no de los artículos. Estiman Mishne&Glance que la
"comentosfera" supone cerca de un tercio del volumen de la blogosfera,
una parte descuidada en los estudios, como en la tecnología: en general
no se sindican los comentarios: sólo cerca del 2% de la comentosfera lo
estaba (en 2005).
El análisis se basa en un corpus de
unos 645.000 comentarios (todos de 2005), impresionante. No entraré a
discutir la manera en que obtienen los datos, aunque como es de suponer
la búsqueda automatizada tiene tantas virtudes como inconvenientes:
cuadricula mucho lo que se puede buscar, y a veces se eliminan bloques
enormes de datos en principio relevantes porque no cuadran con el método
empleado, como eliminar todo Livejournal, o todos los posts sin enlaces
permanentes. Gajes. Pero hay que darlo por bueno: Datos principales
aportados por Mishne&Glance:
- 685.976 posts
analizados, con 645.042 comentarios - a 0'9 comentarios por post, aunque
como veremos esto no funciona por términos medios. Sólo el 15% de los
posts tienen comentarios. De los comentados, el número medio de
comentarios es de 6'3, la mediana 2, y la desviación media 20'5.
- Algunos datos sorprenden, y hasta duda uno de su exactitud. Por ejemplo, el número de blogs sin ningún comentario: el 78 %. Y
eso que han eliminado blogs inactivos, o falsos, o blogs de un solo
post para el análisis. Esa es otra: estos pseudo-blogs o neonatos
muertos son una parte importante de todos los supuestos millones de
blogs (más de 56 millones hoy según Blogpulse). Admiten los autores que
su corpus sólo contiene cerca de una cuarta parte de los comentarios
correspondientes a su corpus de blogs. Con lo cual, hay que
relativizar...
- Media de palabras por post: 63; mediana, 31; desviación: 93.
Aunque no presentan los gráficos con la forma típica de cola larga,
así hay que verlos: "un pequeño número de posts [y de blogs] con un
gran numero de comentarios y una larga cola de posts [y de blogs] con
pocos comentarios [o ninguno]". Y otro gráfico de larga cola para la
longitud de los comentarios: pocos extraordinariamente largos, pocos
largos, muchos cortos.
Y lo mismo se aplica sin duda a la relación entre cantidad de texto y número de comentarios, o a otras dimensiones no tenidas en cuenta en este estudio, como la presencia relativa de comentaristas específicos o su índice de retorno,
así como a la relación entre actividad lectora y actividad
comentarística: muchos lectores silenciosos o comentadores ocasionales
(la larga cola) con pocos de ellos proporcionando altos índices de
comentarios. Pero como digo, estas dimensiones no entran en este
estudio.
Otras conclusiones no sorprendentes: que los
comentarios aportan contenido, que ayudan a la localización temática
automatizada de un artículo por palabras clave, que ayudan a medir la
relevancia de un post... Que los blogs más enlazados y más visitados son
también más comentados... y otras inevitabilidades estadísticas. Con
las excepciones que señalan los autores: al usarse con relativa
frecuencia la opción de desactivar comentarios, también hay blogs
relevantes con pocos comentarios o sin ellos. También se apunta la razón
del caso contrario, blogs poco enlazados y poco relevantes pero muy
comentados—en el caso de pequeños grupos que utilizan los comentarios
como si fueran un chat (con lo cual dejan de ser comentarios al post, y
hasta a su tema). Usos diversos para la misma cosa.
Me ha interesado el intento de cuantificar automáticamente las
disputas, desacuerdos o desavenencias en los comentarios. La mayoría de
los comentarios son "consonantes" con el autor o con otros
comentaristas, pero un 16% de los comentarios son disonantes o
"disputative" (y un 21% de las series de comentarios). Los asuntos que
más se prestan a desavenencias son los políticos, religiosos e
ideológicos.
La manera de captar las frases que indican
actitud subjetiva fue comparar el corpus de entradas de la Wikipedia
con el corpus de comentarios de usuarios en la misma. Claro que habrá
comentarios (por ejemplo muchos míos) que muestran desacuerdo sin usar
frases con alto nivel de subjetividad. Y, por otra parte, la diferencia
entre el acuerdo y el desacuerdo es un continuo. No obstante, el método
seguido aquí parece adecuado para analizar grandes masas de datos a
grandes rasgos, for what it's worth (a mí me va más, y estoy mejor
equipado para, el microanálisis de matices). Otros datos: los
comentarios disputativos tienden a ser más largos y a aparecer en series
de comentarios más largas. No observan los autores el retorno de los
comentadores disputativos a la discusión, pero también obviamente hay
más interacción sostenida en torno a una disputa que en torno a un
acuerdo.
Autoevaluación a la luz de estos datos: Que
mis posts son larguísimos, mi relación entre cantidad de texto del
artículo y comentarios recibidos es atroz, y va a peor, que estoy en la
larga cola de blogs no comentados o poco comentados. Poco comentado,
incluso, en relación al número de visitas...
aunque a base de perseverancia y muchos posts sí tengo más comentarios,
en términos absolutos, que muchos que le dedican menos tiempo y
esfuerzo. Y que si bien antes tenía comentarios con desavenencias, han
ido desapareciendo, para dejarme hablar solo en una amplia llanura de
silencio, en la que puedo largar a gusto lo que tenga que decir, sin que
valga la pena ponerse a discutir conmigo. Lo bueno del caso es que no
se puede uno sentir solo, entre tantos blogs sin comentario.
No hay comentarios:
Publicar un comentario
Se aceptan opiniones alternativas, e incluso coincidentes: