Kolejny miesiąc na karku Tawerny Hrothgara... Jak wygląda dziś statystyka? W miesiącu wrześniu napisaliśmy ~1400 postów, więc jakby nie patrzeć jest to skok w górę na mniej więcej 300 wiadomości! Nikomu zasług przypisywać nie trzeba, ot udało się nam naskrobać coś więcej niż w ostatnich dwóch miesiącach.
Osobiście jakąś tam pracę włożyłem w rozwój forum, czy się sprawdziło i spodobało? Nie mnie to oceniać, mogę mieć tylko nadzieję, że "Filozofowie" się nie zatrzymają i dalej będą z jakąś tam prędkością się rozwijali... Pomysły nowe są... Nawet kilka. Teraz jednak czekam na odpowiedż Wodza w sprawie najpilniejszego projektu.
Dzisiaj z ciekawości spojrzałem sobie w statystyki forum... I muszę powiedzieć, że październik i listopad wypadają strasznie kiepsko... Kolejno ~900 i ~600 postów... Gdzie się podziali więc wszyscy spamerzy? Dobrze, że Durendal nabijał jakieś wiadomości, bo przecież inaczej poniżej 500 miesięcznie byśmy zeszli... Joke.
Jak to dawno, dawno temu, pewien mądry człowiek powiedział:
Cytat:
[Wczoraj 10:18] Gawith: ileż można pieprzyć o Baldursie...
I słowo ciałem się stało xD Ja bym sobie chętnie pogawędził, jeśli byłby odpowiedni temat, albo chociaż porobił sobie jaja Cóż, statystyki faktycznie marne, ale wiadomym było, że nie utrzymamy formy z wakacji
Jakże ja dawno nie trułem ludziom rzyci o statystyce naszego forum? W sumie zaglądając dzisiaj w liczby, wychodzi, że od grudnia mamy systematyczny wzrost ilości postów... Ostatni miesiąc zeszłego roku to ~600 nowych wiadomości, aczkolwiek styczeń to już ~800 postów... W lutym wynik jeszcze lepszy, a i marzec zapowiada się całkiem przyzwoicie. Czyżby na Tawernie Hrothgara niczym w naturze, wiosną wszyscy budzą się do życia?
Korelacja miedzy nowych postów a ilością nowych tematów jest silna i wynosi 0,73 (max. 1,00) natomiast korelacja między ilością nowych postów a ilością nowych użytkowników jest średnia i wynosi 0,48.
Oczywiście nie jest to związek przyczynowo skutkowy. Stosunkowo wysoka korelacja miedzy ilością nowych użytkowników a nowych postów jest moim zdaniem przypadkowa.
Niestety oba przypadki nie najlepiej tłumaczą wzrost ilości postów, o czym świadczą współczynniki determinacji (odpowiednio 53% i 23% zmian ilości nowych postów może być tłumaczone przez wymienione czynniki). Ponadto średnie odchylenie faktycznych wartości od teoretycznych jest bardzo duże (45% i 57%) co świadczy o tym, że na podstawie ilości nowych tematów i userów nie da się za wiele przewidzieć.
Jeśli potraktujemy ilość nowych postów jako wynik łącznego wpływu nowych wzrostu ilości userów i tematów sytuacja zmienia się następująco: zależność między nowymi userami a tematami spada do 0,37 a zależność między nowymi tematami a postami spada do 0,69. Całkowita korelacja miedzy tymi dwoma czynnikami a nowymi postami wynosi 0,58 czyli jest średnio - duża.
Dla zainteresowanych dokładne wartości:
Mała korelację i nieprzewidywalność potwierdza korelacyjny diagram rozrzutu:
Podsumowując: wzrost ilości postów jest najmocniej powiązany ze wzrostem ilości nowych tematów. Jednak trudno mówić tu o związku przyczynowo skutkowym, raczej o objawach. Nowi użytkownicy niewiele zwiększają ilość postów, jednak pokusiłbym się tutaj o zaproponowanie metody badania związku między ilością nowych użytkowników a ilością nowych postów w następnym miesiącu, choć nie wydaje mi się by wiele to dało.
Podobnie niewiele mówi analiza trendu wzrostu ilości postów. Licząc trend od maja 2007 roku (wcześniej, nawet jak pojawiały się posty, trudno mówić o trendzie) nie widać wyraźnego trendu. O analizie sezonowości trudno też mówić dysponując tak małą próbą danych. Niemniej spróbowałem, ale z kiepskim skutkiem:
Różowy kolor określa teoretyczny trend, natomiast niebieski empiryczne wielkości.
Jak widać obliczony trend ma się nijak to rzeczywistości. Wynika to zapewne z obłąkańczej metody, którą wymusiły braki w danych.
Dla ciekawych:
Na zanalizowanie czeka jeszcze trend wzrostu ilości nowych użytkowników (co może nawet coś dać i się przydać), ilości nowych tematów (co chyba nic dać nie może ) oraz modyfikacja metody znajdywania trendu.
Nieaktualne
Ostatnio zmieniony przez Major 2009-09-23, 10:41, w całości zmieniany 3 razy
Na początku zaznaczę, że oparłem się nie na liczbie nowych postów w danym miesiącu, ale na całkowitej liczbie postów w danym miesiącu. Czyli na liczbie nowych postów w danym miesiącu razem z postami z wcześniejszych miesięcy.
Ponadto wykorzystałem dwa wskaźniki.
Odchylenie standardowe składnika resztowego: Sy – czyli średni błąd przewidywań. Pokazuje ile przeciętnie różnią się faktyczne wielkości od wielkości wyliczonych na podstawie trendu….
…oraz Wy (nie mylić z współczynnikiem zmienności resztowej) – wskaźnik wprowadzony przeze mnie (przynajmniej nie miałem go na wykładach) – pokazuje stosunek błędu przewidywań do średniego wzrostu ilości np. użytkowników. Im większy tym funkcja trendu gorzej opisuje zjawisko. Jeśli średni wzrost ilości użytkowników to 30, ale średni błąd przewidywań to 100 to model taki nie ma sensu, a Wy = 333,33%.
W skrócie: im mniejsze Sy i Wy tym lepiej.
Ponadto użyłem też określenie „pod-trend”. Nie wiem jak statystyka jako nauka ma się do tego, ale wydaje mi się to dość logiczne. Pod-to trend wyliczony na podstawie wycinka danych, a nie całości danych. Pokazuje trend, który panował (lub panuje) przez chwilę.
Liczba użytkowników.
Dane od stycznie 2007.
Pomarańczowa linia pokazuje trend obliczony dla całej historii wzrostu ilości użytkowników. Niestety, jest niedokładna, Wy = 139,11%. Ponadto widać wyraźnie, ze trend się zmienił po drodze, a dwa pod-trendy opisują zmiany o wiele bardziej dokładnie (Wy = 31,66% i 25,10%).
Oczywiście pod trend najprawdopodobniej nie będzie trwał wiecznie. Jednak można spróbować przewidzieć na jego podstawie liczbę przyszłych użytkowników.
W tym celu trzeba wstawić numer przyszłego miesiąca pod t.
Tworząc funkcję trendu użyłem 15 okresów, a więc kolejny okres ma numer 16.
Y^ = 436+25,48*16 +/-7,49
Y^ = 844 +/-7,49
7,49 to Sy, Zawsze przewidując (estymując) podaje się średni błąd przewidywań.
A więc, jeśli pod-trend się utrzyma, to liczba użytkowników wynosić będzie. Między 836 a 852.
Jeśli natomiast nie utrzyma się to prawdopodobnie liczba nowych użytkowników będzie zgodna z trendem pomarańczowym (Y^= -64,74+26,39t +/- 34,9 || t = 33)., jednak ten trend jest bardzo niedokładny (błąd obliczeń jest w nim większy niż średni wzrost).
Liczba Postów
Dane od Maja 2007
Podobnie jak w przypadku ilości użytkowników pojawiają się tutaj pod-trendy, jednak najprawdopodobniej jeden z nich nie jest liniowy, ale potęgowy. Jeśli jednak w lutym lub marcu ilość postów osiągnie dno to oznaczać będzie, że to trend liniowy, ale z bardzo zaznaczoną sezonowością! Wydaje się to zresztą bardzo prawdopodobne, zważywszy na wysoką korelację miedzy ilością postów, a ilością tematów, które z kolei nie wykazują trendu potęgowego (bądź jest on niewidoczny, względnie wysokie dopasowanie funkcji trendu potęgowego do liczby postów to przypadek).
Zgodnie z podanymi tam danymi przewidywania ilości postów na następny miesiąc to 19653,16 +/- 250,81 czyli między 19402 a 19904.
Liczba Tematów
Dane od maja 2007.
Tutaj niestety trudno mówić o przewidywaniu. Wy = 104,84%
Pod-trendy są bardzo krótkie, Jest oczywiście możliwość, że występuje w tym niewidoczna jeszcze sezonowość.
Oczywiście wszystkie powyższe „analizy” traktować należy z przymrużeniem oka. Tak naprawdę by z sensem badać jakiekolwiek trendy czy inne sezonowości należy mieć dane z okresu 10 letniego.
Nie możesz pisać nowych tematów Nie możesz odpowiadać w tematach Nie możesz zmieniać swoich postów Nie możesz usuwać swoich postów Nie możesz głosować w ankietach Nie możesz załączać plików na tym forum Nie możesz ściągać załączników na tym forum