LINEST (Συνάρτηση LINEST)

Σε αυτό το άρθρο περιγράφονται η σύνταξη τύπου και η χρήση της συνάρτησης  LINEST στο Microsoft Excel. Βρείτε συνδέσεις σε περισσότερες πληροφορίες σχετικά με τη δημιουργία γραφημάτων και την πραγματοποίηση ανάλυσης παλινδρόμησης στην ενότητα Δείτε επίσης.

Περιγραφή

Η συνάρτηση LINEST υπολογίζει τα στατιστικά στοιχεία για μια ευθεία χρησιμοποιώντας τη μέθοδο των "ελαχίστων τετραγώνων" για τον υπολογισμό μιας ευθείας γραμμής που εφαρμόζει καλύτερα στα δεδομένα σας και, στη συνέχεια, επιστρέφει έναν πίνακα που περιγράφει τη γραμμή. Επίσης, μπορείτε να συνδυάσετε τη συνάρτηση LINEST με άλλες συναρτήσεις για να υπολογίσετε στατιστικά στοιχεία για άλλους τύπους μοντέλων τα οποία έχουν γραμμική σχέση με τις άγνωστες παραμέτρους, όπως πολυωνυμική, λογαριθμική, εκθετική σειρά και δυναμοσειρά. Επειδή η συνάρτηση αυτή επιστρέφει έναν πίνακα τιμών, πρέπει να εισάγεται ως τύπος πίνακα. Σε αυτό το άρθρο, τα παραδείγματα ακολουθούνται από οδηγίες.

Η εξίσωση της ευθείας είναι:

y = mx + b

–ή–

y = m1x1 + m2x2 + ... + b

εάν υπάρχουν πολλές περιοχές τιμών x, όπου οι εξαρτημένες τιμές y είναι συνάρτηση των ανεξάρτητων τιμών x. Οι τιμές m είναι συντελεστές που αντιστοιχούν σε κάθε τιμή x, ενώ η b είναι μια σταθερά. Σημειώνεται ότι τα x, y και m μπορεί να είναι ανύσματα. Ο πίνακας που επιστρέφει η συνάρτηση LINEST είναι της μορφής {mn\mn-1\...\m1\b}. Η συνάρτηση LINEST μπορεί επίσης να επιστρέψει πρόσθετα στατιστικά στοιχεία παλινδρόμησης.

Σύνταξη

LINEST(γνωστά_y; [γνωστά_x]; [σταθερά]; [στατιστικές])

Η σύνταξη της συνάρτησης LINEST περιλαμβάνει τα παρακάτω ορίσματα:

Σύνταξη

  • γνωστά_y    Υποχρεωτικό. Το σύνολο των γνωστών τιμών του y, στη σχέση y = mx + b.

    • Εάν η περιοχή του ορίσματος γνωστά_y έχει μία μόνο στήλη, κάθε στήλη του ορίσματος γνωστά_x θεωρείται ως ξεχωριστή μεταβλητή.

    • Εάν η περιοχή του ορίσματος γνωστά_y περιέχεται σε μία μόνο γραμμή, κάθε γραμμή του ορίσματος γνωστά_x θεωρείται ως ξεχωριστή μεταβλητή.

  • γνωστά_x    Προαιρετικό. Ένα σύνολο γνωστών τιμών του x, στη σχέση y = mx + b.

    • Η περιοχή του ορίσματος γνωστά_x μπορεί να περιλαμβάνει ένα ή περισσότερα σύνολα μεταβλητών. Εάν χρησιμοποιείτε μόνο μία μεταβλητή, τα ορίσματα γνωστά_y και γνωστά_x μπορούν να είναι περιοχές οποιουδήποτε σχήματος, αρκεί να έχουν ίσες διαστάσεις. Εάν χρησιμοποιούνται περισσότερες από μία μεταβλητές, το όρισμα γνωστά_y πρέπει να είναι άνυσμα (δηλαδή, μια περιοχή με ύψος μίας μόνο γραμμής ή πλάτος μίας μόνο στήλης).

    • Εάν παραλειφθεί το όρισμα γνωστά_x, θεωρείται ίσο με έναν πίνακα {1\2\3\...} με μέγεθος ίδιο με του πίνακα γνωστά_y.

  • σταθερά    Προαιρετικό. Μια λογική τιμή που καθορίζει εάν η σταθερά b θα θεωρηθεί ίση με το μηδέν.

    • Εάν το όρισμα σταθερά είναι TRUE ή παραλείπεται, η σταθερά b υπολογίζεται κανονικά.

    • Εάν το όρισμα σταθερά είναι FALSE, η σταθερά b θεωρείται ίση με το 0 και οι τιμές m αναπροσαρμόζονται, ώστε y = mx.

  • στατιστικές    Προαιρετικό. Μια λογική τιμή που καθορίζει αν θα επιστραφούν πρόσθετα στατιστικά στοιχεία παλινδρόμησης.

    • Εάν το όρισμα στατιστικές είναι TRUE, η συνάρτηση LINEST επιστρέφει πρόσθετα στατιστικά στοιχεία παλινδρόμησης, οπότε ο πίνακας που επιστρέφεται είναι της μορφής {mn\mn-1\...\m1\b;sen\sen-1\...\se1\seb;r2\sey;F\df;ssreg\ssresid}.

    • Εάν το όρισμα στατιστικές είναι FALSE ή παραλείπεται, η συνάρτηση LINEST επιστρέφει μόνο τους συντελεστές m και τη σταθερά b.

      Τα πρόσθετα στατιστικά στοιχεία παλινδρόμησης είναι τα ακόλουθα.

Στατιστική τιμή

Περιγραφή

se1,se2,...,sen

Οι τιμές τυπικού σφάλματος για τους συντελεστές m1,m2,...,mn.

seb

Η τιμή τυπικού σφάλματος για τη σταθερά b (seb = #Δ/Υ, όταν το όρισμα σταθερά είναι FALSE).

r2

Ο συντελεστής προσδιορισμού. Συγκρίνει τις εκτιμώμενες και τις πραγματικές τιμές y και η τιμή του κυμαίνεται από 0 έως 1. Εάν ο συντελεστής προσδιορισμού είναι 1, υπάρχει πλήρης γραμμική συσχέτιση στο δείγμα — δηλαδή δεν υπάρχει διαφορά ανάμεσα στην υπολογισμένη τιμή y και την πραγματική τιμή y. Αντίθετα, αν ο συντελεστής προσδιορισμού είναι 0, η εξίσωση παλινδρόμησης δεν είναι χρήσιμη για την πρόβλεψη τιμών του y. Για πληροφορίες σχετικά με τη μέθοδο υπολογισμού του συντελεστή προσδιορισμού r2, δείτε τις "Παρατηρήσεις", στη συνέχεια του θέματος.

sey

Το τυπικό σφάλμα εκτίμησης της τιμής του y.

F

Η στατιστική τιμή F ή παρατηρούμενη τιμή F. Χρησιμοποιήστε τη στατιστική τιμή F, για να καθορίσετε αν είναι τυχαία η παρατηρούμενη συσχέτιση μεταξύ των εξαρτημένων και των ανεξάρτητων μεταβλητών.

df

Οι βαθμοί ελευθερίας. Χρησιμοποιήστε τους βαθμούς ελευθερίας για να βρείτε κρίσιμες τιμές F σε κάποιον στατιστικό πίνακα. Συγκρίνετε τις τιμές που θα βρείτε στον πίνακα, με τη στατιστική τιμή F που επιστρέφει η συνάρτηση LINEST για να καθορίσετε ένα επίπεδο εμπιστοσύνης για το μοντέλο. Για πληροφορίες σχετικά με τη μέθοδο υπολογισμού των βαθμών ελευθερίας df, δείτε τις "Παρατηρήσεις", στη συνέχεια του θέματος. Το παράδειγμα 4 δείχνει τον τρόπο χρήσης των τιμών F και df.

ssreg

Το παλινδρομικό άθροισμα των τετραγώνων.

ssresid

Το υπολειπόμενο άθροισμα των τετραγώνων. Για πληροφορίες σχετικά με τον τρόπο υπολογισμού των τιμών ssreg και ssresid, δείτε τις "Παρατηρήσεις", στη συνέχεια του θέματος.

Η ακόλουθη απεικόνιση παρουσιάζει τη σειρά με την οποία επιστρέφονται τα πρόσθετα στατιστικά στοιχεία παλινδρόμησης.

Φύλλο εργασίας

Παρατηρήσεις

  • Μπορείτε να περιγράψετε μια ευθεία γραμμή με την κλίση της και το σημείο τομής με τον άξονα y:

    Κλίση (m):
    Για να υπολογίσετε την κλίση, που αναφέρεται συχνά ως m, μιας ευθείας, επιλέξτε δύο σημεία επάνω στη γραμμή, (x1,y1) και (x2,y2). Η κλίση είναι ίση με (y2 - y1)/(x2 - x1).

    Σημείο τομής με τον άξονα y (b):
    Το σημείο τομής με τον άξονα y, που αναφέρεται συχνά ως b, μιας ευθείας είναι η τιμή του y στο σημείο όπου η ευθεία τέμνει τον άξονα y.

    Η εξίσωση μιας ευθείας γραμμής είναι y = mx + b. Εφόσον γνωρίζετε τις τιμές των συντελεστών m και b, μπορείτε να υπολογίσετε οποιοδήποτε σημείο επάνω στην ευθεία, εισάγοντας στην εξίσωση την τιμή του y ή του x. Μπορείτε επίσης να χρησιμοποιήσετε τη συνάρτηση TREND.

  • Όταν έχετε μόνο μία ανεξάρτητη μεταβλητή x, μπορείτε να υπολογίσετε απευθείας τις τιμές της κλίσης και του σημείου τομής με τον άξονα y, χρησιμοποιώντας τους εξής τύπους:

    Κλίση:
    =INDEX(LINEST(γνωστά_y;γνωστά_x);1)

    Σημείο τομής με τον άξονα y:
    =INDEX(LINEST(γνωστά_y;γνωστά_x);2)

  • Η ακρίβεια της ευθείας που υπολογίζεται από τη συνάρτηση LINEST εξαρτάται από το βαθμό διασποράς των δεδομένων σας. Όσο πιο γραμμικά είναι τα δεδομένα, τόσο ακριβέστερο είναι το μοντέλο της LINEST. Η συνάρτηση LINEST χρησιμοποιεί τη μέθοδο των ελαχίστων τετραγώνων για να προσδιορίσει τη βέλτιστη ευθεία για τα δεδομένα σας. Όταν έχετε μόνο μία ανεξάρτητη μεταβλητή x, οι υπολογισμοί των συντελεστών m και b βασίζονται στους εξής τύπους:

    Εξίσωση

    Εξίσωση

    όπου x και y είναι οι μέσες τιμές δείγματος, δηλαδή, x = AVERAGE(γνωστά_x) και y = AVERAGE(γνωστά_y).

  • Η συνάρτηση προσαρμογής ευθείας LINEST και η συνάρτηση προσαρμογής καμπύλης LOGEST μπορούν να προσαρμόσουν τα δεδομένα σας σε ευθεία γραμμή ή εκθετική καμπύλη, αντίστοιχα. Πρέπει, ωστόσο, να αποφασίσετε ποιο από τα δύο αποτελέσματα έχει την καλύτερη προσαρμογή στα δεδομένα σας. Μπορείτε να υπολογίσετε τη συνάρτηση TREND(γνωστά_y;γνωστά_x) για ευθεία γραμμή ή τη συνάρτηση GROWTH(γνωστά_y, ;γνωστά_x) για εκθετική καμπύλη. Οι συναρτήσεις αυτές, χωρίς το όρισμα νέα_x, επιστρέφουν έναν πίνακα με τις προβλεπόμενες τιμές του y κατά μήκος της ευθείας ή της καμπύλης προσαρμογής στα σημεία των δεδομένων σας. Μπορείτε τότε να συγκρίνετε τις προβλεπόμενες τιμές με τις πραγματικές τιμές. Μπορείτε επίσης να συμπεριλάβετε τις τιμές αυτές σε ένα γράφημα, για οπτική σύγκριση.

  • Στην ανάλυση παλινδρόμησης, το Excel υπολογίζει σε κάθε σημείο το τετράγωνο της διαφοράς της εκτιμώμενης τιμής του y και της πραγματικής τιμής του y στο σημείο αυτό. Το άθροισμα των τετραγώνων αυτών των διαφορών λέγεται υπολειπόμενο άθροισμα των τετραγώνων, ssresid. Το Excel υπολογίζει στη συνέχεια το συνολικό άθροισμα των τετραγώνων, sstotal. Όταν το όρισμα σταθερά = TRUE ή παραλείπεται, το συνολικό άθροισμα των τετραγώνων είναι το άθροισμα των τετραγώνων των διαφορών μεταξύ των πραγματικών τιμών του y και του μέσου όρου των τιμών του y. Όταν το όρισμα σταθερά = FALSE, το συνολικό άθροισμα των τετραγώνων είναι το άθροισμα των τετραγώνων των πραγματικών τιμών y (χωρίς την αφαίρεση του μέσου όρου των τιμών του y από κάθε μεμονωμένη τιμή του y). Στη συνέχεια, το άθροισμα των τετραγώνων παλινδρόμησης, ssreg, μπορεί να υπολογιστεί από τον τύπο: ssreg = sstotal - ssresid. Όσο μικρότερο είναι το υπολειπόμενο άθροισμα των τετραγώνων σε σύγκριση με το συνολικό άθροισμα των τετραγώνων, τόσο μεγαλύτερη είναι η τιμή του συντελεστή προσδιορισμού, r2, ο οποίος δείχνει πόσο καλά περιγράφεται η σχέση μεταξύ των μεταβλητών από την εξίσωση που προκύπτει από την ανάλυση παλινδρόμησης. Η τιμή r2 είναι ίση με το λόγο ssreg/sstotal.

  • Σε ορισμένες περιπτώσεις, μία ή περισσότερες από τις στήλες X (με την παραδοχή ότι οι τιμές Y και X βρίσκονται σε στήλες) ενδέχεται να μην έχουν καμία πρόσθετη αξία πρόβλεψης εξαιτίας της παρουσίας των υπόλοιπων στηλών X. Με άλλα λόγια, η απαλοιφή μίας ή περισσότερων στηλών X ενδέχεται να οδηγήσει σε προβλεπόμενες τιμές Y οι οποίες είναι εξίσου ακριβείς. Σε αυτήν την περίπτωση, οι πλεονάζουσες στήλες X πρέπει να παραλειφθούν από το μοντέλο παλινδρόμησης. Το φαινόμενο αυτό ονομάζεται “συγγραμμικότητα” επειδή οποιαδήποτε πλεονάζουσα στήλη X μπορεί να εκφραστεί ως άθροισμα πολλαπλάσιων των μη πλεοναζουσών στηλών X. Η συνάρτηση LINEST ελέγχει αν υπάρχει συγγραμμικότητα και καταργεί οποιεσδήποτε πλεονάζουσες στήλες X από το μοντέλο παλινδρόμησης όταν τις εντοπίσει. Οι στήλες X που έχουν καταργηθεί μπορούν να αναγνωριστούν στο αποτέλεσμα της συνάρτησης LINEST καθώς έχουν συντελεστή 0 όπως επίσης και μηδενικές τιμές se. Όταν μία ή περισσότερες στήλες καταργηθούν ως πλεονάζουσες, τότε επηρεάζεται η τιμή df επειδή εξαρτάται από τον αριθμό των στηλών X που χρησιμοποιούνται για σκοπούς πρόγνωσης. Για λεπτομέρειες σχετικά με τον υπολογισμό της τιμής df, ανατρέξτε στο παράδειγμα 4. Όταν η τιμή df αλλάξει εξαιτίας της κατάργησης των πλεοναζουσών στηλών X, επηρεάζονται επίσης οι τιμές sey και F. Στην πράξη, η συγγραμμικότητα εμφανίζεται σχετικά σπάνια. Ωστόσο, μία περίπτωση όπου είναι πιθανό να προκύψει, είναι όταν ορισμένες στήλες X περιέχουν μόνο τους αριθμούς 0 και 1 ως δείκτες για το αν το υποκείμενο ενός πειράματος είναι ή δεν είναι μέλος μιας συγκεκριμένης ομάδας. Αν το όρισμα σταθερά = TRUE ή παραλείπεται, η συνάρτηση LINEST εισάγει μια πρόσθετη στήλη X με τιμές 1 για τη δημιουργία μοντέλου διέλευσης. Αν έχετε κάποια στήλη όπου ο αριθμός 1 αντιστοιχεί σε κάθε υποκείμενο όταν είναι αρσενικό, ενώ ο αριθμός 0 αντιστοιχεί σε κάθε υποκείμενο όταν δεν είναι αρσενικό και έχετε επίσης μια στήλη όπου ο αριθμός 1 αντιστοιχεί σε κάθε υποκείμενο όταν είναι θηλυκό, ενώ ο αριθμός 0 αντιστοιχεί σε κάθε υποκείμενο όταν δεν είναι θηλυκό, η τελευταία στήλη πλεονάζει επειδή οι καταχωρήσεις που υπάρχουν σε αυτήν μπορούν να ληφθούν μέσω της αφαίρεσης των καταχωρήσεων της στήλης “ένδειξη αρσενικού” από τις καταχωρήσεις της πρόσθετης στήλης που περιέχει όλες τις τιμές 1 που έχει προστεθεί από τη συνάρτηση LINEST.

  • Η τιμή df υπολογίζεται με τον παρακάτω τρόπο, όταν δεν καταργηθεί καμία στήλη X από το μοντέλο εξαιτίας της ύπαρξης συγγραμμικότητας: αν υπάρχουν k στήλες του ορίσματος γνωστά_x και το όρισμα σταθερά = TRUE ή παραλείπεται, τότε df = n – k – 1. Εάν το όρισμα σταθερά = FALSE, τότε df = n - k. Και στις δύο περιπτώσεις, κάθε στήλη X που καταργήθηκε εξαιτίας της ύπαρξης συγγραμμικότητας, αυξάνει την τιμή df κατά 1.

  • Οι τύποι που επιστρέφουν πίνακες πρέπει να καταχωρούνται ως τύποι πίνακα.

    Σημείωση: Στο Excel Online δεν μπορείτε να δημιουργήσετε τύπους πίνακα.

  • Όταν εισάγετε μια σταθερά πίνακα ως όρισμα (όπως το όρισμα γνωστά_x), χρησιμοποιήστε ανάστροφες καθέτους (\) για να διαχωρίσετε τιμές οι οποίες περιέχονται στην ίδια γραμμή και ερωτηματικά για να διαχωρίσετε γραμμές. Οι χαρακτήρες διαχωρισμού ενδέχεται να είναι διαφορετικοί ανάλογα με τις τοπικές ρυθμίσεις.

  • Ας σημειωθεί ότι οι τιμές του y που προβλέπει η εξίσωση παλινδρόμησης μπορεί να μην είναι έγκυρες αν βρίσκονται εκτός της περιοχής τιμών y που χρησιμοποιήσατε για τον προσδιορισμό της εξίσωσης.

  • Ο υποκείμενος αλγόριθμος που χρησιμοποιείται στη συνάρτηση LINEST είναι διαφορετικός από τον αλγόριθμο που χρησιμοποιείται στις συναρτήσεις SLOPE και INTERCEPT. Η διαφορά μεταξύ αυτών των αλγόριθμων μπορεί να οδηγήσει σε διαφορετικά αποτελέσματα όταν τα δεδομένα είναι απροσδιόριστα και συγγραμικά. Για παράδειγμα, αν τα σημεία δεδομένων του ορίσματος γνωστά_y είναι 0 και τα σημεία δεδομένων του ορίσματος γνωστά_x είναι 1:

    • Η συνάρτηση LINEST επιστρέφει τιμή 0. Ο αλγόριθμος της συνάρτησης LINEST έχει σχεδιαστεί για να επιστρέφει λογικά αποτελέσματα για συγγραμμικά δεδομένα και στη συγκεκριμένη περίπτωση μπορεί να βρεθεί τουλάχιστον μία απάντηση.

    • Οι συναρτήσεις SLOPE και INTERCEPT επιστρέφουν #ΔΙΑΙΡ./0! ως τιμή σφάλματος. Ο αλγόριθμος των συναρτήσεων SLOPE και INTERCEPT έχει σχεδιαστεί για την αναζήτηση μίας μόνο απάντησης και στην περίπτωση αυτή μπορεί να υπάρχουν περισσότερες από μία απαντήσεις.

  • Εκτός από τη χρήση της συνάρτησης LOGEST για τον υπολογισμό στατιστικών στοιχείων για άλλους τύπους παλινδρόμησης, μπορείτε να χρησιμοποιήσετε τη συνάρτηση LINEST για τον υπολογισμό μιας περιοχής άλλων τύπων παλινδρόμησης μέσω της εισαγωγής συναρτήσεων των μεταβλητών x και y ως σειρές x και y για τη συνάρτηση LINEST. Για παράδειγμα, ο ακόλουθος τύπος:

    =LINEST(τιμέςy, τιμέςx^COLUMN($A:$C))

    λειτουργεί όταν έχετε μια στήλη τιμών y και μία στήλη τιμών x για τον υπολογισμό της κυβικής προσέγγισης (πολυωνυμική βαθμού 3) της μορφής:

    y = m1*x + m2*x^2 + m3*x^3 + b

    Μπορείτε να προσαρμόσετε αυτόν τον τύπο για τον υπολογισμό άλλων τύπων παλινδρόμησης, αλλά, σε ορισμένες περιπτώσεις, απαιτείται η προσαρμογή των τιμών που προκύπτουν και των υπόλοιπων στατιστικών στοιχείων.

  • Η τιμή ελέγχου F που επιστρέφει η συνάρτηση LINEST διαφέρει από την τιμή ελέγχου F που επιστρέφει η συνάρτηση FTEST. Η συνάρτηση LINEST επιστρέφει τη στατιστική τιμή F, ενώ η συνάρτηση FTEST επιστρέφει την πιθανότητα.

Παραδείγματα

Παράδειγμα 1 - Κλίση και σημείο τομής στον άξονα y

Αντιγράψτε τα δεδομένα του παραδείγματος στον πίνακα που ακολουθεί και, στη συνέχεια, επικολλήστε τα στο κελί A1 ενός νέου φύλλου εργασίας του Excel. Για να εμφανιστούν τα αποτελέσματα των τύπων, επιλέξτε τους, πατήστε το πλήκτρο F2 και, στη συνέχεια, πατήστε το πλήκτρο Enter. Εάν χρειαστεί, ρυθμίστε το πλάτος των στηλών για να βλέπετε όλα τα δεδομένα.

Γνωστό y

Γνωστό x

1

0

9

4

5

2

7

3

Αποτέλεσμα (κλίση)

Αποτέλεσμα (σημείο τομής y)

2

1

Τύπος (τύπος πίνακα στα κελιά A7:B7)

=LINEST(A2:A5;B2:B5;;FALSE)

Παράδειγμα 2 - Απλή γραμμική παλινδρόμηση

Αντιγράψτε τα δεδομένα του παραδείγματος στον πίνακα που ακολουθεί και, στη συνέχεια, επικολλήστε τα στο κελί A1 ενός νέου φύλλου εργασίας του Excel. Για να εμφανιστούν τα αποτελέσματα των τύπων, επιλέξτε τους, πατήστε το πλήκτρο F2 και, στη συνέχεια, πατήστε το πλήκτρο Enter. Εάν χρειαστεί, ρυθμίστε το πλάτος των στηλών για να βλέπετε όλα τα δεδομένα.

Μήνας

Πωλήσεις

1

3.100 €

2

4.500 €

3

4.400 €

4

5.400 €

5

7.500 €

6

8.100 €

Τύπος

Αποτέλεσμα

=SUM(LINEST(B1:B6; A1:A6)*{9\1})

11.000 €

Υπολογίζει τις εκτιμώμενες πωλήσεις τον ένατο μήνα, με βάση τις πωλήσεις των μηνών 1 έως 6.

Παράδειγμα 3 - Πολλαπλή γραμμική παλινδρόμηση

Αντιγράψτε τα δεδομένα του παραδείγματος στον πίνακα που ακολουθεί και, στη συνέχεια, επικολλήστε τα στο κελί A1 ενός νέου φύλλου εργασίας του Excel. Για να εμφανιστούν τα αποτελέσματα των τύπων, επιλέξτε τους, πατήστε το πλήκτρο F2 και, στη συνέχεια, πατήστε το πλήκτρο Enter. Εάν χρειαστεί, μπορείτε να ρυθμίσετε το πλάτος των στηλών για να βλέπετε όλα τα δεδομένα.

Έκταση ορόφου (x1)

Γραφεία (x2)

Είσοδοι (x3)

Παλαιότητα (x4)

Εκτιμώμενη αξία (y)

2310

2

2

20

142.000 €

2333

2

2

12

144.000 €

2356

3

1,5

33

151.000 €

2379

3

2

43

150.000 €

2402

2

3

53

139.000 €

2425

4

2

23

169.000 €

2448

2

1,5

99

126.000 €

2471

2

2

34

142.900 €

2494

3

3

23

163.000 €

2517

4

4

55

169.000 €

2540

2

3

22

149.000 €

-234,2371645

13,26801148

0,996747993

459,7536742

1732393319

Τύπος (τύπος πίνακα που καταχωρήθηκε στα κελιά A14:A18)

=LINEST(E2:E12;A2:D12;TRUE;TRUE)

Παράδειγμα 4 - Χρήση των στατιστικών τιμών F και r2

Στο προηγούμενο παράδειγμα, ο συντελεστής προσδιορισμού r2, είναι 0,99675 (δείτε το κελί A16 στο αποτέλεσμα της συνάρτησης LINEST), που θα μπορούσε να σημαίνει ισχυρό συσχετισμό μεταξύ της αξίας του κτιρίου και των ανεξάρτητων μεταβλητών. Μπορείτε να χρησιμοποιήσετε τη στατιστική τιμή F για να προσδιορίσετε αν προέκυψε τυχαία ένα τέτοιο αποτέλεσμα με τόσο υψηλή τιμή του r2.

Ας υποθέσουμε, προς το παρόν, ότι δεν υπάρχει πραγματική σχέση μεταξύ των μεταβλητών, αλλά έχετε επιλέξει ένα σπάνιο δείγμα 11 κτιρίων γραφείων που έχει ως αποτέλεσμα η στατιστική ανάλυση να παρουσιάζει ισχυρό συσχετισμό. Ο όρος "Άλφα" χρησιμοποιείται για την πιθανότητα του εσφαλμένου συμπεράσματος ότι υπάρχει συσχετισμός.

Οι τιμές F και df του αποτελέσματος της συνάρτησης LINEST μπορούν να χρησιμοποιηθούν για τον προσδιορισμό της πιθανότητας τυχαίας εμφάνισης υψηλότερης τιμής F. Η τιμή F μπορεί να συγκριθεί με κρίσιμες τιμές σε δημοσιευμένους πίνακες κατανομής F ή μπορεί να χρησιμοποιηθεί η συνάρτηση FDIST του Excel για τον υπολογισμό της πιθανότητας τυχαίας εμφάνισης μεγαλύτερης τιμής F. Η κατάλληλη κατανομή F έχει βαθμούς ελευθερίας v1 και v2. Όταν n είναι ο αριθμός των σημείων δεδομένων και το όρισμα σταθερά = TRUE ή παραλείπεται, τότε v1 = n – df – 1 και v2 = df. (Εάν σταθερά = FALSE, τότε v1 = n - df και v2 = df.) Η συνάρτηση FDIST  - με τη σύνταξη FDIST(F,v1,v2) - επιστρέφει την πιθανότητα τυχαίας εμφάνισης υψηλότερης τιμής F. Σε αυτό το παράδειγμα, df = 6 (κελί B18) και F = 459,753674 (κελί A18).

Αν λάβουμε μια υποθετική τιμή Άλφα 0,05, v1 = 11 – 6 – 1 = 4 και v2 = 6, το κρίσιμο επίπεδο της F είναι 4,53. Αφού η τιμή F = 459,753674 είναι πολύ υψηλότερη της τιμής 4,53, είναι εξαιρετικά απίθανο να έχει προκύψει τυχαία αυτή η τιμή F. (Με το Άλφα = 0,05 , η υπόθεση ότι δεν υπάρχει σχέση μεταξύ των ορισμάτων γνωστά_x και γνωστά_x θα απορριφθεί όταν η τιμή F υπερβαίνει το κρίσιμο επίπεδο 4,53.) Μπορείτε να χρησιμοποιήσετε τη συνάρτηση FDIST του Excel για να λάβετε την πιθανότητα τυχαίας εμφάνισης μιας τόσο υψηλής τιμής F. Για παράδειγμα, FDIST(459,753674; 4; 6) = 1,37E-7, υπάρχει εξαιρετικά μικρή πιθανότητα. Μπορείτε να διαπιστώσετε, είτε μέσω της εύρεσης του κρίσιμου επιπέδου της τιμής F ενός πίνακα είτε χρησιμοποιώντας τη συνάρτηση FDIST, ότι η εξίσωση παλινδρόμησης είναι χρήσιμη για την πρόγνωση της εκτιμώμενης αξίας των κτιρίων γραφείων σε αυτήν την περιοχή. Μην ξεχνάτε ότι είναι απαραίτητο να χρησιμοποιείτε τις σωστές τιμές v1 και v2 που έχουν υπολογιστεί στην προηγούμενη παράγραφο.

Παράδειγμα 5 - Υπολογισμός της στατιστικής τιμής t

Ένας άλλος έλεγχος υποθέσεων θα καθορίσει κατά πόσο στον υπολογισμό της εκτιμώμενης αξίας του κτιρίου γραφείων στο παράδειγμα 3, είναι χρήσιμος κάθε συντελεστής κλίσης. Για παράδειγμα, για να ελέγξετε το συντελεστή παλαιότητας για τη στατιστική σημασία του, διαιρέστε την τιμή -234,24 (συντελεστής κλίσης παλαιότητας) με την τιμή 13,268 (το εκτιμώμενο τυπικό σφάλμα για τον συντελεστή παλαιότητας στο κελί A15). Η ακόλουθη είναι η παρατηρούμενη στατιστική τιμή t:

t = m4 ÷ se4 = -234,24 ÷ 13,268 = -17,7

Εάν η απόλυτη τιμή t είναι αρκετά υψηλή, μπορείτε να συμπεράνετε ότι ο συντελεστής κλίσης είναι χρήσιμος για τον υπολογισμό της εκτιμώμενης αξίας ενός κτιρίου γραφείων στο παράδειγμα 3. Στον παρακάτω πίνακα εμφανίζονται οι απόλυτες τιμές των 4 παρατηρούμενων τιμών t.

Εάν συμβουλευτείτε έναν πίνακα σε ένα εγχειρίδιο στατιστικής, θα βρείτε ότι η αμφίπλευρη κρίσιμη τιμή t, με 6 βαθμούς ελευθερίας και Άλφα = 0,05, είναι 2,447. Αυτή η κρίσιμη τιμή μπορεί επίσης να ληφθεί χρησιμοποιώντας τη συνάρτηση TINV του Excel. TINV(0,05;6) = 2,447. Επειδή η απόλυτη τιμή του t (17,7) είναι μεγαλύτερη από την κρίσιμη τιμή 2,447, η παλαιότητα είναι σημαντική για τον υπολογισμό της εκτιμώμενης αξίας του κτιρίου. Κάθε μια από τις υπόλοιπες ανεξάρτητες μεταβλητές μπορεί να ελεγχθεί, με ανάλογο τρόπο, για τη στατιστική σημασία της. Ακολουθούν οι παρατηρούμενες τιμές t για κάθε μια ανεξάρτητη μεταβλητή.

Μεταβλητή

Παρατηρούμενη τιμή t

Έκταση ορόφου

5,1

Αριθμός γραφείων

31,3

Αριθμός εισόδων

4,8

Παλαιότητα

17,7

Οι τιμές αυτές έχουν όλες απόλυτη τιμή μεγαλύτερη από 2,447, επομένως, όλες οι μεταβλητές που χρησιμοποιούνται στην εξίσωση παλινδρόμησης είναι χρήσιμες για την πρόβλεψη της εκτιμώμενης αξίας των κτιρίων γραφείων στην περιοχή αυτή.

Αναπτύξτε τις δεξιότητές σας
Εξερευνήστε το περιεχόμενο της εκπαίδευσης
Αποκτήστε πρώτοι τις νέες δυνατότητες
Γίνετε μέλος του Office Insider

Σας βοήθησαν αυτές οι πληροφορίες;

Σας ευχαριστούμε για τα σχόλιά σας!

Σας ευχαριστούμε για τα σχόλιά σας! Φαίνεται ότι μπορεί να είναι χρήσιμο να συνδεθείτε με έναν από τους συνεργάτες υποστήριξης του Office.

×