>>>BETFAN - TRIUMF BONUSA NAD BOOSTEM <<<<
>>> BETCLIC - ZAKŁAD BEZ RYZYKA DO 50 ZŁ + GRA BEZ PODATKU!<<<
>>> FUKSIARZ - ZERO RYZYKA 100% DO 50 ZŁ. ZWROT W GOTÓWCE!<<<

Statystyczna analiza danych. Cel: znaleźć edge!

kosa248 456

kosa248

Użytkownik
Ogłoszenie

Niewielkiej zmianie ulega wygląd pliku i sposób wprowadzania danych.
Powody:

1. Z kursów u/o 2,5 w zasadzie wynikają wszystkie pozostałe (i dlatego tylko u/o 2,5 będą przydatne),
2. Niemieszanie danych liczbowych i ciągów znakowych w tych samych kolumnach ułatwi mi pisanie algorytmów,
3. Dopisanie nazwy ligi jest konieczne do łączenia wszystkich danych &quot;do kupy&quot; a później na podstawie jednego algorytmu napisanego dla tych danych, analizowania poszczególnych lig (czyli program musi wiedzieć, które mecze dotyczą których lig, gdy wszystko znajdzie się w jednej tabeli). W sumie dziwne, że tej konieczności nie przewidziałem.
4. Oznaczenie &quot;45+&quot; na czas doliczony pierwszej połowy jest nieprzydatne i na sam koniec i tak trzeba zmienić na 45, aby policzyć różne statystyki, bo program interpretuje &quot;45+&quot; jako ciąg znaków.
5. Nazwy kolumn nie zaszkodzą, a się przydadzą.

W efekcie proszę o zapoznanie się z:


----------------------------
AKTUALNA INSTRUKCJA
----------------------------

1. Wpisujemy nazwy kolumn - kolejno:
LIGA
DATA
GOSP (nazwa drużyny gospodarzy)
GOSC (gości)
WYNIK
SK1 (średni kurs na &quot;jedynkę&quot;)
SKX (remis)
SK2 (&quot;dwójka&quot;)
KOF (kurs otwarcia na faworyta, czyli na drużynę o niższym średnim kursie)
KZF (kurs zamknięcia na faworyta)
O2.5 (średni kurs na over 2,5)
U2.5 (średni kurs na under 2,5)
-----UWAGA----- koniecznie kropki w nazwach O2.5 i U2.5
Kolejne kolumny to kolejno: Z1 (zdarzenie 1), Z2, Z3 itd., aż do Z16 (tyle było do tej pory zdarzeń w jednym meczu [goli plus kartek] i ciężko będzie to pobić)

2. W pierwszej kolumnie, w każdym wierszu wpisujemy ligę. Format zapisu: polska1, anglia3 itd., żaden inny.

3. Wchodzimy na stronę flashscore.com, wybieramy ligę, zaznaczamy potrzebne mecze i kopiujemy do excela w odpowiednie miejsce (tak żeby daty były pod &quot;DATA&quot;, wynik pod &quot;WYNIK&quot; itd.)

4. Po skopiowaniu meczów, wchodzimy na oddsportal.com i przepisujemy ręcznie, bądź kopiujemy średnie kursy na 1, x, 2 (lepiej kopiować, bo się nie pomylimy), jednak kopiując sprawdzamy, czy na oddsportal są mecze w tej samej kolejności, jak na flashscore. Nie musi tak być na przykład dlatego, że nazwy drużyn mogą być inne (na oddsportal SC Farense, na flashscore Farense), przez co kolejność alfabetyczna spotkań rozegranych o tej samej porze może być różna.

4a. Jeżeli kopiowaliśmy, to poleceniem &quot;znajdź i zamień&quot; zamieniamy kropki na przecinki, a następnie klikając prawym przyciskiem na obszar kursów wybieramy polecenie &quot;usuń hiperłącza&quot;.

5. Sortujemy skopiowane mecze względem daty. Bezpieczniej jest zrobić to ręcznie, ponieważ zdarzyło mi się, że przy takim posortowaniu zostały zamienione kursy między dwoma meczami rozegranymi o tej samej porze.

6. W odpowiednich kolumnach wpisujemy kursy otwarcia i zamknięcia na faworyta oraz średnie kursy over/under 2,5.

Kolejne punkty dotyczą przepisywania danych z flashscore. Ewentualnie w przypadku egzotycznej ligi może być tak, że nie ma minut z kartkami na flashscore. Wówczas posługujemy się soccerway zamiast flashscore.

6. Pod aktualnie wypełnianym spotkaniem wstawiamy dokładnie 5 nowych pustych wierszy.

Ogólna zasada:
. pierwsze dwa wiersze (ten z ligą, datą, meczem itd. plus kolejny) dotyczą minut, w których padły gole,
. kolejne dwa dotyczą minut, w których zostały przyznane żółte kartki,
. ostatnie dwa dotyczą minut, w których zostały przyznane czerwone kartki (czyli zwykle pozostaną one puste),
. wiersze nieparzyste dotyczą drużyny gospodarzy (lub ogólniej drużyny, która jest wymieniona jako pierwsza)
. wiersze parzyste dotyczą drużyny gości.

7. Wpisujemy chronologicznie, poruszając się w prawą stronę, kolejne zdarzenia, jakie nastąpiły w meczu, związane z bramkami i kartkami.

Przykład:
Załóżmy, że nastąpiły kolejno: żółta kartka dla gości w 33. minucie, bramka dla gospodarzy w 50. minucie, czerwona kartka dla gospodarzy w 70. minucie.
Robimy tak: w czwartym wierszu dla tego spotkania, w kolumnie Z1 wpisujemy liczbę 33. Następnie przechodzimy do kolumny Z2 i w pierwszym wierszu dla tego spotkania wpisujemy liczbę 50. Następnie przechodzimy do kolumny Z3 i w piątym wierszu dla tego meczu wpisujemy liczbę 70.
UWAGA! Nie pozbywamy się (nie usuwamy) wierszy, które nie zostały wypełnione.

7a. Jeżeli dwa różne zdarzenia (na przykład żółta kartka dla gospodarzy i żółta kartka dla gości) zdarzyły się w tej samej minucie, zapisujemy je w osobnych kolumnach, gdyż każda kolumna jest zarezerwowana dla oddzielnego zdarzenia.

7b. Jeżeli coś nastąpiło w doliczonym czasie pierwszej połowy (np. zapis &quot;45+1&quot; na flashscore), zapisujemy liczbę 45.

7c. Jeżeli coś nastąpiło w doliczonym czasie drugiej połowy (np. zapis &quot;90+3&quot; na flashscore), zapisujemy nie liczbę 90, ale faktyczną minutę (w tym przypadku 93).



Dodatkowe ważne informacje:

1. Kolejne spotkania dopisujemy, edytując plik dotyczący odpowiedniej ligi.
2. Nazwa pliku - taka, jak kolejne wiersze pierwszej kolumny (polska1, anglia3 itd.), ogólnie nazwa ligi.
3. Typ pliku - CSV (rozdzielany przecinkami)

UWAGA: przed zapisem należy upewnić się, że jako symbol dziesiętny mamy ustawiony przecinek, zaś jako separator listy mamy ustawiony średnik. Jest to ustawienie standardowe, jednak zdarzają się przypadki kropki jako symbolu dziesiętnego oraz przecinka jako separatora listy. Ustawienie to sprawdzamy dla systemu Windows7 w: Panel sterowania --&gt; Region i język --&gt; Ustawienia dodatkowe --&gt; Zakładka Liczby. W razie czego zmieniamy na podane przeze mnie. Wystarczy, że tę zmianę wprowadzicie na czas pracy z plikiem i jego zapisu. Jest to bardzo ważne, ponieważ jeżeli prześlecie mi plik zapisany inaczej, to sposób jego wczytywania do mojego programu jest inny, a chcę mieć możliwie jednolite typy danych i oznaczenia w nich, żeby wszystko &quot;załatwiać&quot; tym samym kodem.

4. Średnie kursy bierzemy ze strony oddsportal.com

5. Kursy otwarcia i zamknięcia bierzemy z oddsportal.com --&gt; Zakładka 1X2 --&gt; szukamy bukmachera P i n n a c l e (piszę z przerwą, bo dla początkujących userów nie wyświetlają się linki), nakierowujemy kursor na kurs na faworyta. Pojawia się historia kursów. Kurs zamknięcia to ten na górze, a otwarcia to ten na dole listy (opening odds).

5a. W przypadku, gdy brakuje kursów z P i n n a c l e (tylko dla egzotycznych lig), kursy otwarcia i zamknięcia na faworyta bierzemy z bet 3 6 5 (nie ma opcji, żeby ich nie było).

6. Konieczne jest, aby mieć konto na oddsportal i być zalogowanym w momencie spisywania kursów, gdyż wtedy uwzględnionych jest więcej bukmacherów.

7. Pliki przesyłamy w miarę na bieżąco (raz na tydzień, maksymalnie dwa tygodnie w przypadku choroby, wyjazdu itd.) na adres: statystykisportowe(malpa)gmail(kropka)com. Mile widziane jest oznajmienie, jaki okres został dopisany w porównaniu do poprzednio przesłanego pliku oraz jaki okres jest uwzględniony w całym pliku (na przykład &quot;Dopisane: 11-14.01, całość: 01-14.01).

8. Pytania zadawajcie w tym temacie, na pw lub wysyłając wiadomość na podany powyżej adres.



Oczywiście osobom, które już przesyłały mi pliki z danymi, wyślę te pliki poprawione przeze mnie, tak aby same nie musiały tego robić. Spodziewajcie się wiadomości dziś wieczorem.

Może wygląda to tak, jakby tych instrukcji było za dużo, ale po pierwszym tygodniu wszystko będzie dla Was oczywiste (dla tych, którzy już zbierają dane, zmienia się niewiele). Dzięki tym ścisłym regułom unikniemy nieporządku, którego ogarnienie mogłoby być czasochłonne.

W załączniku jest przykładowy plik, na którym można się wzorować. Mogę przesłać jedynie printscreen, ponieważ forum nie akceptuje plików csv.
 
kosa248 456

kosa248

Użytkownik
O proszę, dzięki edi! Nie spodziewałem się, że te dane gdzieś będą dostępne. Zaskoczyło mnie to. Na pewno się przyda ta strona ????
 
kosa248 456

kosa248

Użytkownik
Ogłoszenie

Wiem, że miałem tutaj wstawić wstępną analizę zebranych danych, ale od momentu tej deklaracji utrudniła mi się sytuacja na studiach. Zbierałem się od weekendu, żeby o tym napisać, ale uwierzcie, że miałem ważniejsze rzeczy na głowie.

Jak ktoś czytał o moich kolokwiach, które miały miejsce w zeszłym tygodniu... Trzy z nich poszły zgodnie z planem (tj. zdane na 4 albo 4,5), ale przerżnąłem Równania różniczkowe cząstkowe, które dziś musiałem poprawić (co mi się udało), więc weekend miałem zajęty właśnie przez te równania. W ogóle pierwszy raz na mojej uczelni zdarzył mi się kolos, który można było poprawić ????

Do tego w międzyczasie (jakoś przed weekendem) został ogłoszony projekt z Teorii ryzyka - niby taki krótki, prosty, więc zabrałem się do niego dopiero dziś po kolosie, ale zeszło mi długo, bo był na podstawie fragmentu książki, który samemu trzeba było przerobić i tam były nowe rzeczy. Wysłałem dosłownie 5 minut przed deadlinem :cool:

Teraz niestety wcale nie będzie lepiej, bo tak to wygląda:

28.01 - odp. ustna z projektu
28.01 - angielski - egzamin ustny
30.01 - angielski pisemny
01.02 - procesy stochastyczne pisemny - tutaj na szczęście jestem zwolniony :cool: Ale:
02.02 - procesy stochastyczne ustny - i muszę już zacząć się uczyć
04.02 - modele matematyki finansowej - jedyny &quot;lajtowy&quot;, ale potem:
05.02 - równania różniczkowe cząstkowe, z których jeszcze nie czuję się dobry,
06.02 - Teoria ryzyka - ustny - i ten termin jest niedobry, bo liczyłem na to, że będę zdawał 9ego (egzamin jest rozłożony na kilka dni), ale mam wtedy wyjazd nie do przełożenia i musi tak być. Muszę zacząć się z tego przygotowywać, bo później nie wyrobię się ze wszystkim.


Deklarując termin 25-27 stycznia na zaprezentowanie analizy danych zakładałem, że ostatni egzamin będę miał 9.02, nie będę musiał poprawiać równań różniczkowych oraz nie wiedziałem o projekcie. Dwie ostatnie rzeczy uniemożliwiły mi posiedzenie nad tym w ciągu ostatnich 4 dni, a pierwsza nie pozwala na zrobienie tego jeszcze przed sesją. No bo wolę mieć spokój w sesji poprawkowej.
 
scigant 76

scigant

Użytkownik
Chciałbym przyłączyć się do projektu. Czy jest to jeszcze aktualne , jeśli tak to mogę wziąć 2-3 ligi i dołożyć swoją cegiełkę.
 
kosa248 456

kosa248

Użytkownik
UWAGA!

Aby nie pisać do każdego z osobna, piszę tutaj. Wczoraj zamknąłem sesję na studiach i jestem w stanie w końcu wziąć się do roboty. Wiem, że ostatnio nie otrzymywaliście ode mnie żadnych wiadomości. Dziękuję, że nie zwątpiliście i przesyłaliście w dalszym ciągu dane.

Plan jest taki:
Do końca lutego sam zbiorę dane z tych lig, do których nikt nie został przydzielony oraz postaram się zebrać też z tych, które początkowo nie były w planie. Porównując do stycznia, w lutym jest dużo więcej rozgrywek. Czas potrzebny na analizę stycznia i lutego to mniej więcej to samo, co czas potrzebny na sam styczeń, za to efekt będzie lepszy, bo dla większych zbiorów danych więcej rzeczy można stwierdzić oraz z większą pewnością.

To w dalszym ciągu będzie wstępna analiza, ponieważ naturalnie wykluczone będzie porównywanie lig między sobą, o sezonach nie wspominając, jednak będzie można już jakoś te dane pogrupować - na przykład na ligi underowe i overowe, mniej kartek/więcej kartek, albo ze względu na inne kryteria, i porównać różne rzeczy. Na przykład dojść do wniosków w stylu: gdy jest mniej kartek to częściej jest tak (na przykład częściej jest bez gola w końcówce), a gdy jest więcej kartek, to częściej jest inaczej.

Po tym, jak te dane zbiorę, spędzę kilka wieczorów i nocy nad analizą, zrobię ciekawe wykresy, tabele... Następnie wszystko to postaram się opisać, tak aby było to zrozumiałe. Wrzucę to w plik pdf, który udostępnię do pobrania.

Chciałbym przyłączyć się do projektu. Czy jest to jeszcze aktualne , jeśli tak to mogę wziąć 2-3 ligi i dołożyć swoją cegiełkę.
Jak najbardziej.
Daj mi czas do wieczora. Wtedy dam ci do wyboru ligi. Muszę wszystko uporządkować, ponieważ w czasie sesji na studiach (która trochę się przedłużyła) nie śledziłem rozgrywek i muszę po prostu &quot;ogarnąć&quot;, co się dzieje.
 
S 0

ssebek

Użytkownik
Jeżeli nie jest za późno to i ja chciałbym przyłączyć się do &quot;akcji&quot;. Jakimi ligami miałbym się ewentualnie zająć?
 
kosa248 456

kosa248

Użytkownik
Jeżeli nie jest za późno to i ja chciałbym przyłączyć się do &quot;akcji&quot;. Jakimi ligami miałbym się ewentualnie zająć?
Witaj. Nie jest za późno, jednak proponuję coś innego. Dotyczy to wszystkich zainteresowanych i już zbierających dane.

Za bardzo pozwoliłem na to, aby to rozciągnęło się w czasie. Mam taką propozycję:

Do końca marca sam będę zbierał dane. Każdego dnia z 2-3 lig. Tutaj będę pisał na bieżąco, jaki jest plan na dany dzień i ile zostało zrealizowane. Przez ten okres nie musicie wysyłać żadnych danych. Proponuję, aby każdy z Was poczekał na analizę danych, które zbiorę i później jeszcze raz podejmiecie decyzję, czy chcecie kontynuować zbieranie danych, w momencie gdy będą Wam znane KONKRETY.

Plan na dziś: WŁOCHY 1, WŁOCHY 2, POLSKA 1, POLSKA 2 - okres od początku roku do 1. weekendu marca.
 
kosa248 456

kosa248

Użytkownik
Głupio mi to przyznać, ale zapomniałem o tym, że miałem tutaj wstawiać aktualizacje dotyczące postępu w zbieraniu danych. Póki co zebrałem mniej więcej 50% tego, co zakładałem.

Jedna osoba zapytała mnie ostatnio, co dalej z projektem. Wkleję tutaj odpowiedź, jaką jej wysłałem, żeby wszyscy byli poinformowani:

Hej,

To nie jest koniec projektu, jednak póki co dane z okresu styczeń - marzec wystarczą. Z tych osób, które brały sobie ligi zaczynające dopiero za jakiś czas, nikt potem się nie odezwał i jest nas łącznie tylko 5 osób... Dlatego dużą część danych zbieram sam. Na forum opublikuję analizę na podstawie ok. 10 tys. spotkań z pierwszych trzech miesięcy, ale to jeszcze trochę potrwa. W międzyczasie uczę się nowego, lepszego programu do analizy, który jest jednak bardzo rozbudowany i jego składnia znacznie się różni od tego, z którym do tej pory miałem do czynienia.
Proponuję Ci poczekać na efekty analizy z tych 3 miesięcy, które będą jakoś pod koniec sezonu. Dane z późniejszego okresu i tak nie zostaną tam użyte, bo nie jestem w stanie tyle zebrać. A później będziesz mógł zdecydować, czy chcesz pomagać dalej, bez poczucia że coś robiłeś na darmo. Te dane, które zebrałeś do tej pory, na pewno zostaną wykorzystane. Wyślę do Ciebie maila, gdy na forum pojawi się ich analiza, prawdopodobnie w formie pliku pdf.

Pozdrawiam.
 
Do góry Bottom