Вот так примерно нынче выглядит Moera.
Граф пока не совершенен, составлялся на основе кравлинга начиная от себя, учитывались подписки, но не подписчики.
А вот, в Moera можно вот прямо SVG вставлять (только хостится он должен пока, как и любые другие картинки, вовне, я использовал svgur.com):
Update: картинку заменил на более полную: для затравки @tigra и @lamed, кравлятся и subscribers и subscriptions. И даже снабдил каждое имя ссылкой на страницу. Однако ссылки не работают, думаю, хостинг их стрипает.
Comments (12)
Запишу командную строку для генерации графа, чтоб не потерять:
PNG:
neato -Gpad=0.5 -Gpack=true -Goverlap=prism -Goverlap_shrink=true -LT*2 -Ln1000 -Tpng -Gsize=9,15\! -Gdpi=400 -omoera.png moera.gv
SVG:
neato -Gpad=0.5 -Gpack=true -Goverlap=prism -Goverlap_shrink=true -LT*1 -Ln1000 -Tsvg -Gsize=12,11\! -Gdpi=400 -omoera.svg moera.gv
Есть ещё две части - кравлер и генератор dot-файла для Graphviz
Картинка на imgBB на всякий случай, она кликабельная и там большая.
О, полезно. С кластеризацией было бы ещё полезнее, но даже так можно посмотреть, на кого подписаться
Кстати, спасибо за место для хостинга SVG
С какой кластеризацией?
Не знаю, какая кластеризация тут лучше подходит.
neato
использует алгоритм Kamada-Kawai, которому за 30 лет, с тех пор много интересного придумали. Но я не гинеколог ☺Первая версия svg (заменена в посте):
Ну на мой взгляд, это всё таки не кластеринг, а алгоритм лейаута графа на плоскости (а более общо - dimentionality reduction, по возможности меньше портящий расстояния).
Разница довольно существенная - кластеринг это дискретно-оптимизационная проблема, а лейаут - непрерывная.
Не исключено, что где-то некоторых из алгоритмов лейаута внутри таки кластеринг есть. Но тут пружинки итерационно колеблются.
Visualization of the Kamada-Kawai layout algorithm from Computational Legal Studies on Vimeo.
а чем определяется близость к центру и вообще положение на картинке?
Kamada-Kawai представляет рёбра как пружинки и оптимизирует полную энергию. Вершины с большой валентностью автоматически проваливаются ближе к центру
в смысле у кого связей больше?
Да, те, у кого связей больше, в среднем оказываются ближе к центру, а у кого их 1-2 - растопыриваются по периферии.
В целом алгоритм стремится расположить тех, кто связан, по возможности рядом. Связь - это пружинка, которая стремится сжаться, если растянута и удлиниться, если сжата.
И поэтому логично, что те, кто связаны почти со всеми, оказываются в центре.
Но если у нас есть два сильно связанных кластера, слабо связанных между собой, то в центре может оказаться как раз тот, у кого связей не сильно много, но кто имеет связи с обоими кластерами.