Multiple Linear Regression Premises, Method and Uses



The wielokrotna regresja liniowa jest narzędziem obliczeniowym, które bada związki przyczynowo-skutkowe obiektów badań i testuje złożone hipotezy.

Jest używany w matematyce i statystyce. Ten typ regresji liniowej wymaga zmiennych zależnych (innymi słowy wyników) i zmiennych niezależnych (tj. Przyczyn), które następują w porządku hierarchicznym, oprócz innych czynników właściwych dla różnych obszarów badań..

Zwykle regresja liniowa jest regresją reprezentowaną przez funkcję liniową obliczaną z dwóch zmiennych zależnych. Najważniejszym z nich jest to, że badane zjawisko ma prostą linię regresji.

W danym zbiorze danych (x1, y1) (xn, yn) i wartości, które odpowiadają parze zmiennych losowych w bezpośredniej korelacji ze sobą, linia regresji może przyjąć, na początek, formę równania, jak y = a · x + b .

Teoretyczne przesłanki obliczeń w wielokrotnej regresji liniowej

Wszelkie obliczenia z wykorzystaniem wielokrotnej regresji liniowej zależą w dużym stopniu od badanego obiektu i obszaru badań, takich jak ekonomia, ponieważ zmienne powodują, że stosowane formuły mają złożoność różną w zależności od przypadku.

Oznacza to, że im bardziej skomplikowane jest to pytanie, tym więcej czynników należy wziąć pod uwagę, tym więcej danych musi być zebranych, a zatem większa objętość elementów do uwzględnienia w obliczeniach, co spowoduje zwiększenie formuły..

Jednak wspólne we wszystkich tych formułach jest to, że istnieje oś pionowa (jedna z rzędnych lub oś Y) i oś pozioma (jedna z odciętych lub oś X), które po obliczeniu są przedstawione graficznie za pomocą układu kartezjańskiego.

Stamtąd dokonywane są interpretacje danych (patrz następna sekcja) i wyciągane są wnioski lub przewidywania. W każdym przypadku przesłanki przedstatystyczne mogą być używane do ważenia zmiennych, takich jak:

1- Słaba egzogeniczność

Oznacza to, że zmienna musiałaby zostać przyjęta ze stałą wartością, która z trudem nadaje się do zmian w swoim modelu z powodu przyczyn zewnętrznych dla siebie.

2-liniowy charakter

Oznacza to, że wartości zmiennych, jak również innych parametrów i współczynników predykcji, muszą być pokazane jako liniowa kombinacja elementów, które można przedstawić na wykresie, w układzie kartezjańskim.

3- Homocedastyczność

To musi być stałe. Oznacza to, że niezależnie od zmiennych predykcyjnych, musi istnieć taka sama wariancja błędów dla każdej zmiennej zmiennej odpowiedzi.

4- Niezależność

Dotyczy to tylko błędów zmiennych odpowiedzi, które muszą być pokazane oddzielnie, a nie jako grupa błędów reprezentujących zdefiniowany wzorzec.

5- Brak wieloliniowości

Jest używany dla zmiennych niezależnych. Dzieje się tak, gdy próbujesz coś studiować, ale dostępnych jest bardzo mało informacji, więc może być wiele odpowiedzi, a zatem wartości mogą mieć wiele interpretacji, które ostatecznie nie rozwiązują problemu.

Istnieją inne przesłanki, które są brane pod uwagę, ale przedstawione powyżej jasno pokazują, że wielokrotna regresja liniowa wymaga wielu informacji nie tylko w celu uzyskania bardziej rygorystycznego, kompletnego i wolnego od uprzedzeń, ale aby rozwiązanie problemu propozycja jest konkretna.

Oznacza to, że musi iść do rzeczy z czymś bardzo specyficznym, specyficznym, który nie nadaje się do niejasności i że w mniejszym stopniu powoduje błędy.

Należy pamiętać, że wielokrotna regresja liniowa nie jest nieomylna i może być podatna na błędy i niedokładności w obliczeniach. To nie tyle z powodu tego, kto wykonuje badanie, ale dlatego, że konkretne zjawisko natury nie jest całkowicie przewidywalne lub koniecznie jest produktem konkretnej przyczyny.

Często zdarza się, że jakikolwiek obiekt może się nagle zmienić lub że wydarzenie wynika z działania (lub braku działania) wielu elementów, które oddziałują ze sobą.

Interpretacje grafiki

Po obliczeniu danych zgodnie z modelami zaprojektowanymi w poprzednich fazach badania, formuły przyniosą wartości, które można przedstawić na wykresie.

W tej kolejności pomysłów system kartezjański pokaże wiele punktów, które odpowiadają obliczonym zmiennym. Niektóre będą bardziej w osi rzędnych, podczas gdy inne będą bardziej w osi odciętych. Niektóre będą bardziej zgrupowane, podczas gdy inne będą bardziej odizolowane.

Aby zauważyć złożoność interpretacji danych wykresów, możemy zaobserwować na przykład kwartet Ascombe. W tym kwartecie obsługiwane są cztery różne zestawy danych, a każdy z nich jest na osobnym wykresie, dlatego zasługuje na osobną analizę.

Liniowość pozostaje, ale punkty w układzie kartezjańskim muszą być uważnie oglądane, zanim poznają, jak układają się części układanki. Następnie można wyciągnąć odpowiednie wnioski.

Oczywiście istnieje kilka sposobów, aby te elementy pasowały do ​​siebie, chociaż postępują według różnych metod opisanych w specjalistycznych podręcznikach obliczeniowych..

Wielokrotna regresja liniowa, jak już powiedziano, zależy od wielu zmiennych w zależności od przedmiotu badania i pola, w którym jest stosowana, tak że procedury w ekonomii nie są takie same jak w medycynie lub w informatyce. W sumie, tak, dokonywana jest ocena, hipoteza, która jest następnie sprawdzana na końcu.

Rozszerzenia wielokrotnej regresji liniowej

Istnieje kilka rodzajów regresji liniowej, takich jak prosta i ogólna, ale istnieje również kilka aspektów regresji wielokrotnej, które dostosowują się do różnych obiektów badań, a zatem do potrzeb nauki..

Zazwyczaj obsługują one dużą liczbę zmiennych, więc często można zobaczyć modele takie jak wielowymiarowe lub wielopoziomowe. Każdy używa postulatów i formuł o różnej złożoności, tak że interpretacja ich wyników ma większe znaczenie..

Metody szacowania

Istnieje szeroki zakres procedur szacowania danych uzyskanych w regresji wielokrotnej.

Po raz kolejny wszystko tutaj będzie zależeć od solidności zastosowanego modelu, wzorów obliczeniowych, liczby zmiennych, postulatów teoretycznych, które zostały wzięte pod uwagę, obszaru badań, algorytmów programowanych w specjalistycznych programach komputerowych, i , par excellence, złożoność analizowanego obiektu, zjawiska lub zdarzenia.

Każda metoda szacowania wykorzystuje zupełnie inne formuły. Żadna nie jest doskonała, ale ma unikalne zalety, które należy wykorzystać zgodnie z przeprowadzonym badaniem statystycznym.

Istnieją wszystkie rodzaje: zmienne instrumentalne, uogólnione najmniejsze kwadraty, regresja liniowa Bayesa, modele mieszane, regularyzacja Tyjonova, regresja kwantyli, estymator Theila-Sena i długa lista narzędzi, dzięki którym dane mogą być badane z większą precyzją. 

Praktyczne zastosowania

Wielokrotna regresja liniowa jest stosowana w różnych dziedzinach nauki, aw wielu przypadkach wymagana jest pomoc programów komputerowych w celu uzyskania dokładniejszych danych.

W ten sposób zmniejsza się margines błędu, który może wynikać z ręcznych obliczeń (biorąc pod uwagę obecność wielu niezależnych i zależnych zmiennych, nie jest zaskakujące, że ten typ regresji liniowej nadaje się do błędów, ponieważ istnieje wiele danych i czynników przetworzone).

Na przykład w analizie trendów rynkowych sprawdza się, czy jakiekolwiek dane, takie jak ceny produktu, wzrosły i zmalały, ale przede wszystkim, kiedy i dlaczego.

Czas jest analizowany tylko wtedy, gdy występują istotne zmiany w liczbach w danym okresie czasu, głównie jeśli zmiany są nieoczekiwane. Dlaczego szukasz dokładnych lub prawdopodobnych czynników, dzięki którym ten produkt wzrósł, spadł lub utrzymał cenę detaliczną?.

Podobnie nauki o zdrowiu (medycyna, bioanaliza, farmacja, epidemiologia, między innymi) korzystają z wielokrotnej regresji liniowej, dzięki której badają wskaźniki zdrowia, takie jak wskaźnik umieralności, zachorowalność i wskaźnik urodzeń..

W takich przypadkach możemy zacząć od badania, które zaczyna się od obserwacji, chociaż później opracowuje się model w celu określenia, czy zmiana niektórych z wymienionych wskaźników wynika z określonej przyczyny, kiedy i dlaczego.

Finanse wykorzystują również wielokrotną regresję liniową, aby zbadać zalety i wady dokonywania pewnych inwestycji. Tutaj zawsze trzeba wiedzieć, kiedy dokonywane są transakcje finansowe, z kim i jakie były oczekiwane korzyści.

Poziomy ryzyka będą wyższe lub niższe zgodnie z różnymi czynnikami branymi pod uwagę przy ocenie jakości tych inwestycji, biorąc również pod uwagę wielkość wymiany walutowej.

Jednak w gospodarce jest najczęściej używane to narzędzie obliczeniowe. Dlatego w tej nauce stosuje się wielokrotną regresję liniową w celu przewidywania wydatków konsumpcyjnych, wydatków inwestycyjnych, zakupów, eksportu, importu, aktywów, popytu na pracę, ofert pracy i wielu innych elementów..

Wszystkie są związane z makroekonomią i mikroekonomią, będąc pierwszym, w którym zmienne analizy danych są bardziej obfite, ponieważ są zlokalizowane globalnie..

Referencje

  1. Baldor, Aurelio (1967). Geometria płaszczyzny i przestrzeni z wprowadzeniem do trygonometrii. Caracas: Editorial Cultura Venezolana, S.A..
  2. Szpital Uniwersytecki Ramón y Cajal (2017). Model wielokrotnej regresji liniowej. Madryt, Hiszpania: HRC, Wspólnota Madrytu. Źródło: www.hrc.es.
  3. Pedhazur, Elazar J. (1982). Regresja wielokrotna w badaniach behawioralnych: Wyjaśnienie i przewidywanie, wydanie 2. Nowy Jork: Holt, Rinehart i Winston.
  4. Rojo Abuín, J.M. (2007). Wielokrotna regresja liniowa Madryt, Hiszpania: Centrum Nauk Humanistycznych i Społecznych. Odzyskany z humanities.cchs.csic.es.
  5. Autonomiczny Uniwersytet w Madrycie (2008). Wielokrotna regresja liniowa Madryt, Hiszpania: UAM. Odzyskany z web.uam.es.
  6. University of A Coruña (2017). Model wielokrotnej regresji liniowej; Korelacja La Coruña, Hiszpania: UDC, Wydział Matematyki. Odzyskany z dm.udc.es.
  7. Uriel, E. (2017). Wielokrotna regresja liniowa: estymacja i właściwości. Walencja, Hiszpania: Uniwersytet w Walencji. Odzyskane ze strony www.uv.es.
  8. Barrio Castro, Tomás del; Clar López, Miquel i Suriñach Caral, Jordi (2002). Model wielokrotnej regresji liniowej: specyfikacja, estymacja i kontrast. Katalonia: Redakcja UOC.