Google Trends - korelacja Excel
Google Trends — znajdowanie korelacji i analiza w Excel
Instrukcja krok po kroku: jak korzystać z Google Trends, jak pobrać dane i obliczyć korelację w Excel.
Czym jest Google Trends i do czego służy?
Google Trends to narzędzie, które pokazuje popularność zapytań w wyszukiwarce Google w czasie. Pozwala porównywać zainteresowanie różnych fraz, obserwować sezonowość, trendy regionalne i szybkie zmiany w zainteresowaniu użytkowników. Dane odczytywane są na wartościach skali (zwykle 0–100) w wybranym zakresie czasowym.
Co to jest korelacja?
Korelacja to miara stopnia, w jakim dwie zmienne zmieniają się razem. Współczynnik korelacji Pearsona przyjmuje wartości od −1 do +1. Wartość bliska +1 oznacza, że zmienne rosną razem (pozytywna korelacja), bliska −1 oznacza, że jedna rośnie, a druga maleje (ujemna korelacja), a wartość bliska 0 oznacza brak liniowej korelacji. Uwaga: korelacja nie oznacza przyczynowości.
Przykłady (kliknij, aby otworzyć w Google Trends)
Silna pozytywna korelacja (podobny poziom i wspólne wzrosty/spadki)
Kot vs Pies — otwórz w Google Trends
→ obie frazy mają podobne, stałe zainteresowanie; wykresy zwykle idą w parze (sezonowe fluktuacje podobne).
Silna negatywna / przeciwna sezonowość (peaki w różnych porach roku)
Opony letnie vs Opony zimowe — otwórz w Google Trends
→ kiedy rośnie zainteresowanie „opony zimowe”, spada „opony letnie” i odwrotnie — typowa przeciwna sezonowość.
Sezonowa korelacja (te same piki w tym samym czasie)
Grypa vs Katar — otwórz w Google Trends
→ obie frazy mają zimowe piki — oczekiwana pozytywna sezonowość.
Brak wyraźnej korelacji (przykład niezależnych tematów)
Kawa vs Kino — otwórz w Google Trends
→ zwykle niezależne wzorce wyszukiwań (może podobne średnie poziomy, ale bez związku).
Korelacja z opóźnieniem (lead/lag) — jedna fraza "prowadzi" drugą
Pogoda vs Parasol — otwórz w Google Trends
→ prognozy/pogoda mogą „prowadzić” do wzrostu zainteresowania parasolami (często krótkie opóźnienie).
Przeciwne piki (silne odwrotne reagowanie)
Śnieg vs Lody — otwórz w Google Trends
→ „śnieg” rośnie zimą, „lody” latem — wyraźna odwrotna sezonowość.
Pozorna (spurious) korelacja
Matura vs Lato — otwórz w Google Trends
→ obie frazy pikują w czerwcu, ale przyczyna jest różna (egzaminy ≠ ogólne lato) — przykład pozornego powiązania.
Instrukcja: pobierz dane i policz korelację w Excel
- Otwórz link z powyższych przykładów (każdy link ma
date=alligeo=PL, dzięki czemu pobierzesz pełny zakres danych dla Polski). - Pobierz CSV z wykresu „Zainteresowanie w czasie” (menu trzy kropki → "Download CSV").
- Import do Excela: Data → From Text/CSV (lub otwórz plik bezpośrednio). Jeśli używasz polskiego Excela upewnij się, że separatorem jest średnik.
- Funkcje w Excel (polskie nazwy):
- WSP.KORELACJI (ang. CORREL):
=WSP.KORELACJI(B2:B25;C2:C25)
- PEARSON (ang. PEARSON):
=PEARSON(B2:B25;C2:C25)
- WSP.KORELACJI (ang. CORREL):
- Interpretacja: wartość od −1 do +1. Więcej w sekcji poniżej.
Rodzaje korelacji i możliwe przyczyny
- Korelacja dodatnia (silna): obie serie zmieniają się w tym samym kierunku. Przyczyny: wspólny czynnik popytowy, te same preferencje użytkowników, wspólne kampanie marketingowe.
- Korelacja ujemna: gdy jedna seria rośnie, druga maleje. Przyczyny: zamienna natura produktów (substituty), przeciwna sezonowość (np. opony letnie vs zimowe).
- Sezonowa korelacja: serie mają regularne piki w tych samych okresach. Przyczyny: warunki klimatyczne, święta, okresy szkolne, wydarzenia kalendarzowe.
- Korelacja z opóźnieniem (lead/lag): jedna seria reaguje później na zmiany drugiej. Przyczyny: opóźnione działania konsumentów, czas podejmowania decyzji zakupowych, opóźniona reakcja mediów.
- Brak korelacji: serie niezależne; możliwe przyczyny: różne grupy docelowe, odrębne kanały marketingowe, przypadek.
- Pozorna (spurious) korelacja: serie wydają się skorelowane, ale to wynik trzeciego czynnika lub przypadkowego zbiegu. Przyczyny: wspólna sezonowość, trendy makroekonomiczne, zbiegi dat (np. egzaminy i początek wakacji).
Zawsze sprawdzaj kontekst danych, uwzględniaj sezonowość i testuj hipotezy (np. używaj analizy opóźnień, usuwania sezonowości, regresji wielowymiarowej), żeby uniknąć błędnej interpretacji.
Przykładowy plik z danymi
Kliknij, aby pobrać przykładowy plik CSV.
Google Trends — znajdowanie korelacji i analiza w Excel
Instrukcja krok po kroku: jak korzystać z Google Trends, jak pobrać dane i obliczyć korelację w Excel.
Czym jest Google Trends i do czego służy?
Google Trends to narzędzie, które pokazuje popularność zapytań w wyszukiwarce Google w czasie. Pozwala porównywać zainteresowanie różnych fraz, obserwować sezonowość, trendy regionalne i szybkie zmiany w zainteresowaniu użytkowników. Dane odczytywane są na wartościach skali (zwykle 0–100) w wybranym zakresie czasowym.
Co to jest korelacja?
Korelacja to miara stopnia, w jakim dwie zmienne zmieniają się razem. Współczynnik korelacji Pearsona przyjmuje wartości od −1 do +1. Wartość bliska +1 oznacza, że zmienne rosną razem (pozytywna korelacja), bliska −1 oznacza, że jedna rośnie, a druga maleje (ujemna korelacja), a wartość bliska 0 oznacza brak liniowej korelacji. Uwaga: korelacja nie oznacza przyczynowości.
Przykłady (kliknij, aby otworzyć w Google Trends)
Silna pozytywna korelacja (podobny poziom i wspólne wzrosty/spadki)
Kot vs Pies — otwórz w Google Trends
→ obie frazy mają podobne, stałe zainteresowanie; wykresy zwykle idą w parze (sezonowe fluktuacje podobne).
Silna negatywna / przeciwna sezonowość (peaki w różnych porach roku)
Opony letnie vs Opony zimowe — otwórz w Google Trends
→ kiedy rośnie zainteresowanie „opony zimowe”, spada „opony letnie” i odwrotnie — typowa przeciwna sezonowość.
Sezonowa korelacja (te same piki w tym samym czasie)
Grypa vs Katar — otwórz w Google Trends
→ obie frazy mają zimowe piki — oczekiwana pozytywna sezonowość.
Brak wyraźnej korelacji (przykład niezależnych tematów)
Kawa vs Kino — otwórz w Google Trends
→ zwykle niezależne wzorce wyszukiwań (może podobne średnie poziomy, ale bez związku).
Korelacja z opóźnieniem (lead/lag) — jedna fraza "prowadzi" drugą
Pogoda vs Parasol — otwórz w Google Trends
→ prognozy/pogoda mogą „prowadzić” do wzrostu zainteresowania parasolami (często krótkie opóźnienie).
Przeciwne piki (silne odwrotne reagowanie)
Śnieg vs Lody — otwórz w Google Trends
→ „śnieg” rośnie zimą, „lody” latem — wyraźna odwrotna sezonowość.
Pozorna (spurious) korelacja
Matura vs Lato — otwórz w Google Trends
→ obie frazy pikują w czerwcu, ale przyczyna jest różna (egzaminy ≠ ogólne lato) — przykład pozornego powiązania.
Instrukcja: pobierz dane i policz korelację w Excel
- Otwórz link z powyższych przykładów (każdy link ma
date=alligeo=PL, dzięki czemu pobierzesz pełny zakres danych dla Polski). - Pobierz CSV z wykresu „Zainteresowanie w czasie” (menu trzy kropki → "Download CSV").
- Import do Excela: Data → From Text/CSV (lub otwórz plik bezpośrednio). Jeśli używasz polskiego Excela upewnij się, że separatorem jest średnik.
- Funkcje w Excel (polskie nazwy):
- WSP.KORELACJI (ang. CORREL):
=WSP.KORELACJI(B2:B25;C2:C25)
- PEARSON (ang. PEARSON):
=PEARSON(B2:B25;C2:C25)
- WSP.KORELACJI (ang. CORREL):
- Interpretacja: wartość od −1 do +1. Więcej w sekcji poniżej.
Rodzaje korelacji i możliwe przyczyny
- Korelacja dodatnia (silna): obie serie zmieniają się w tym samym kierunku. Przyczyny: wspólny czynnik popytowy, te same preferencje użytkowników, wspólne kampanie marketingowe.
- Korelacja ujemna: gdy jedna seria rośnie, druga maleje. Przyczyny: zamienna natura produktów (substituty), przeciwna sezonowość (np. opony letnie vs zimowe).
- Sezonowa korelacja: serie mają regularne piki w tych samych okresach. Przyczyny: warunki klimatyczne, święta, okresy szkolne, wydarzenia kalendarzowe.
- Korelacja z opóźnieniem (lead/lag): jedna seria reaguje później na zmiany drugiej. Przyczyny: opóźnione działania konsumentów, czas podejmowania decyzji zakupowych, opóźniona reakcja mediów.
- Brak korelacji: serie niezależne; możliwe przyczyny: różne grupy docelowe, odrębne kanały marketingowe, przypadek.
- Pozorna (spurious) korelacja: serie wydają się skorelowane, ale to wynik trzeciego czynnika lub przypadkowego zbiegu. Przyczyny: wspólna sezonowość, trendy makroekonomiczne, zbiegi dat (np. egzaminy i początek wakacji).
Zawsze sprawdzaj kontekst danych, uwzględniaj sezonowość i testuj hipotezy (np. używaj analizy opóźnień, usuwania sezonowości, regresji wielowymiarowej), żeby uniknąć błędnej interpretacji.
Przykładowy plik z danymi
Kliknij, aby pobrać przykładowy plik CSV.
Na razie nie ma komentarzy.