Matrice dei fattori. Centro per l'ottimizzazione aziendale sistemica e la gestione della qualità - Analisi fattoriale. Criteri per determinare il numero di fattori

Analisi della varianza dei fattori

Matrice dei fattori

Fattore variabile A Fattore B

Come si può vedere dalla matrice, i fattori di carico (o pesi) A e B per le diverse esigenze del cliente differiscono in modo significativo. Il fattore di carico A per il requisito T 1 corrisponde alla tenuta della connessione, caratterizzata da un coefficiente di correlazione pari a 0,83, ovvero buona (stretta) dipendenza. Fattore di carico B per lo stesso requisito dà r k= 0,3, che corrisponde a una debole tenuta del collegamento. Come previsto, il fattore B si correla molto bene con le esigenze dei consumatori T 2, T 4 e T 6.

Considerando che i carichi di fattori di entrambi A e B influenzano i requisiti dei consumatori che non sono nel loro gruppo con una vicinanza non superiore a 0,4 (cioè debole), possiamo presumere che la matrice di intercorrelazione di cui sopra sia determinata da due fattori indipendenti, che in a sua volta, vengono determinati sei requisiti del consumatore (ad eccezione di T 7).

La variabile T 7 potrebbe essere identificata come un fattore indipendente, poiché non ha un carico di correlazione significativo (superiore a 0,4) con qualsiasi esigenza del consumatore. Ma, a nostro avviso, ciò non dovrebbe essere fatto, poiché il fattore "la porta non deve arrugginire" non è direttamente correlato alle esigenze dei consumatori per costruzioni porte.

Pertanto, quando si approvano i termini di riferimento per la progettazione della struttura della portiera dell'auto, sono i nomi dei fattori ottenuti che verranno inseriti come requisiti del consumatore per i quali è necessario trovare una soluzione costruttiva sotto forma di caratteristiche ingegneristiche.

Segnaliamo una proprietà di fondamentale importanza del coefficiente di correlazione tra variabili: al quadrato, mostra quanto della varianza (spread) di una caratteristica è comune a due variabili, quanto queste variabili si sovrappongono. Quindi, ad esempio, se due variabili T 1 e T 3 con una correlazione di 0,8 si sovrappongono con una potenza di 0,64 (0,8 2), ciò significa che il 64% delle varianze di entrambe le variabili è comune, ad es. incontro. Puoi anche dirlo Comunità di queste variabili è pari al 64%.

Ricordiamo che i carichi dei fattori nella matrice dei fattori sono anche coefficienti di correlazione, ma tra fattori e variabili (requisiti del consumatore).

Fattore variabile A Fattore B

Pertanto, il fattore di carico quadratico (varianza) caratterizza il grado di generalità (o sovrapposizione) di una data variabile e di un dato fattore. Determiniamo il grado di sovrapposizione (varianza D) di entrambi i fattori con la variabile (domanda dei consumatori) T 1. Per fare ciò è necessario calcolare la somma dei quadrati dei pesi dei fattori con la prima variabile, cioè 0,83 x 0,83 + 0,3 x 0,3 = 0,70. Pertanto, la comunanza della variabile T 1 con entrambi i fattori è del 70%. Questa è una sovrapposizione piuttosto significativa.


Allo stesso tempo, una bassa generalità può indicare che la variabile misura o riflette qualcosa di qualitativamente diverso dalle altre variabili incluse nell'analisi. Ciò implica che questa variabile non è compatibile con i fattori per uno dei motivi: o misura un altro concetto (come la variabile T 7) o ha un grande errore di misurazione, o ci sono segni che distorcono la varianza.

Va notato che la significatività di ciascun fattore è determinata anche dall'entità della varianza tra le variabili e il carico del fattore (peso). Per calcolare l'autovalore del fattore, è necessario trovare in ogni colonna della matrice dei fattori la somma dei quadrati del fattore di carico per ciascuna variabile. Così, ad esempio, la varianza del fattore A (D A) sarà 2,42 (0,83 x 0,83 + 0,3 x 0,3 + 0,83 x 0,83 + 0,4 x 0,4 + 0 , 8 x 0,8 + 0,35 x 0,35). Il calcolo della significatività del fattore B ha mostrato che D B = 2,64, cioè la significatività del fattore B è maggiore del fattore A.

Se l'autovalore del fattore è diviso per il numero di variabili (nel nostro esempio ce ne sono sette), il valore ottenuto mostrerà quale proporzione della varianza (o la quantità di informazioni) nella matrice di correlazione originale questo fattore farà. Per il fattore A γ ~ 0,34 (34%) e per il fattore B - = 0,38 (38%). Sommando i risultati, otteniamo il 72%. Quindi, i due fattori, quando combinati, riempiono solo il 72% della varianza degli indici della matrice originale. Ciò significa che, come risultato della fattorizzazione, parte delle informazioni nella matrice originale è stata sacrificata per costruire un modello a due fattori. Di conseguenza, è stato perso il 28% delle informazioni, che potrebbero essere ripristinate se fosse adottato il modello a sei fattori.

Dov'è l'errore, visto che si tiene conto di tutte le variabili considerate, relative ai requisiti per la costruzione della porta? È molto probabile che i valori dei coefficienti di correlazione delle variabili relative a un fattore siano in qualche modo sottostimati. Tenendo conto dell'analisi eseguita, sarebbe possibile tornare alla formazione di altri valori dei coefficienti di correlazione nella matrice di intercorrelazione (vedi Tabella 2.2).

In pratica, si trovano spesso di fronte a una situazione in cui il numero di fattori indipendenti è sufficientemente ampio da tenerne conto tutti nella risoluzione di un problema, sia dal punto di vista tecnico che economico. Esistono diversi modi per limitare il numero di fattori. Il più famoso di questi è l'analisi di Pareto. Allo stesso tempo, vengono selezionati quei fattori (al diminuire della loro significatività) che rientrano nel limite dell'80-85% della loro significatività totale.

L'analisi fattoriale può essere utilizzata per implementare il metodo di strutturazione della funzione di qualità (QFD), ampiamente utilizzato all'estero nella formazione di specifiche tecniche per un nuovo prodotto.

L'analisi fattoriale è una branca della statistica matematica. Il suo scopo, come l'obiettivo di altri rami della statistica matematica, è sviluppare modelli, concetti e metodi che consentano di analizzare e interpretare array di dati sperimentali o osservati, indipendentemente dalla loro forma fisica.

Una delle forme più tipiche di presentazione dei dati sperimentali è una matrice, le cui colonne corrispondono a vari parametri, proprietà, test, ecc. e le righe corrispondono a singoli oggetti, fenomeni e modalità descritti da un insieme di parametri specifici valori. In pratica, la dimensione della matrice risulta essere piuttosto grande: ad esempio, il numero di righe di questa matrice può variare da alcune decine a diverse centinaia di migliaia (ad esempio, nelle indagini sociologiche) e il numero di colonne - da uno o due a diverse centinaia. L'analisi diretta e "visiva" di matrici di queste dimensioni è impossibile, quindi, nella statistica matematica, sono emersi molti approcci e metodi progettati per "comprimere" le informazioni iniziali contenute nella matrice in una dimensione osservabile, estrarre il più "essenziale" da le informazioni iniziali, scartando "secondarie", "accidentali".

Quando si analizzano i dati presentati sotto forma di matrice, sorgono due tipi di problemi. I compiti del primo tipo sono finalizzati ad ottenere una “breve descrizione” della distribuzione degli oggetti, mentre i compiti del secondo tipo sono finalizzati a rivelare la relazione tra i parametri.

Si tenga presente che il principale incentivo alla comparsa di questi problemi risiede non solo e non tanto nel desiderio di codificare in breve un ampio array di numeri, ma in una circostanza molto più fondamentale di natura metodologica: non appena è stato possibile descrivere brevemente una vasta gamma di numeri, quindi si può ritenere che sia stata rivelata una certa regolarità oggettiva, che ha portato alla possibilità di una breve descrizione; ed è la ricerca di modelli oggettivi che è l'obiettivo principale per il quale, di regola, vengono raccolti i dati.

Gli approcci e i metodi menzionati per l'elaborazione di una matrice di dati differiscono per il tipo di problema di elaborazione dei dati che intendono risolvere e per le matrici di dimensioni a cui sono applicabili.

Per quanto riguarda il problema di una breve descrizione delle relazioni tra parametri con un numero medio di questi parametri, allora in questo caso la corrispondente matrice di correlazione contiene diverse decine o centinaia di numeri e di per sé non può ancora servire come "breve descrizione" di esistenti relazioni tra i parametri, ma dovrebbe, con questo, al fine di subire ulteriori elaborazioni.

L'analisi fattoriale è solo un insieme di modelli e metodi progettati per "comprimere" le informazioni contenute nella matrice di correlazione. Vari modelli di analisi fattoriale si basano sulla seguente ipotesi: i parametri osservati o misurati sono solo caratteristiche indirette dell'oggetto o del fenomeno oggetto di studio, infatti esistono parametri o proprietà interni (nascosti, non osservati direttamente), il cui numero è piccolo e che determinano i valori dei parametri osservati. Questi parametri interni sono generalmente chiamati fattori. Il compito dell'analisi fattoriale è presentare i parametri osservati sotto forma di combinazioni lineari di fattori e, forse, alcuni valori aggiuntivi "insignificanti" - "rumore". È notevole che, sebbene i fattori stessi non siano noti, tale scomposizione può essere ottenuta e, inoltre, tali fattori possono essere determinati, ad es. per ogni oggetto si possono indicare i valori di ogni fattore.

L'analisi fattoriale, indipendentemente dai metodi utilizzati, inizia con l'elaborazione della tabella di intercorrelazione ottenuta su un insieme di test, nota come matrice di correlazione, e termina con l'ottenimento della matrice fattoriale, ovvero una tabella che mostra il peso o il carico di ciascun fattore per ciascuna prova. La tabella 1 è una matrice di fattori ipotetica con solo due fattori.

I fattori sono elencati nella riga superiore della tabella dal più significativo al meno significativo e il loro peso in ciascuno dei 10 test è indicato nelle colonne corrispondenti.

Tabella 1

Matrice fattoriale ipotetica

Assi coordinati.È consuetudine rappresentare i fattori geometricamente sotto forma di assi coordinati, rispetto ai quali ogni test può essere rappresentato come un punto. Riso. 1 spiega questa procedura. In questo grafico, ciascuno dei 10 test mostrati nella Tabella 1 viene visualizzato come un punto relativo a due fattori che corrispondono agli assi I e II. Pertanto, il test 1 è rappresentato da un punto con coordinate 0,74 lungo l'asse I e 0,54 lungo l'asse II. I punti che rappresentano i restanti 9 test sono costruiti in modo simile, utilizzando i valori dei pesi della tabella. 1.

Va notato che la posizione degli assi coordinati non è fissata dai dati. La tabella delle correlazioni originale determina solo la posizione dei test (cioè i punti in Fig. 1) rispetto l'uno all'altro. Gli stessi punti possono essere tracciati su un piano con qualsiasi posizione degli assi coordinati. Per questo motivo, quando si esegue l'analisi fattoriale, è comune ruotare gli assi fino a ottenere la visualizzazione più adatta e facilmente interpretabile.

Riso. 1. Un'ipotetica mappatura dei fattori che mostri i pesi di due fattori di gruppo per ciascuno dei 10 test.

Nella fig. 1, gli assi I "e II" ottenuti dopo la rotazione sono mostrati in linee tratteggiate. Questa rotazione viene eseguita secondo i criteri proposti da Thurstone varietà positiva e struttura semplice. Il primo prevede la rotazione degli assi in una posizione in cui vengono eliminati tutti i pesi negativi significativi. La maggior parte degli psicologi considera i carichi di fattori negativi logicamente incoerenti con i test di abilità, poiché un tale carico significa che maggiore è il punteggio di un individuo per un fattore specifico, minore è il suo punteggio nel test corrispondente. Il semplice criterio di progettazione significa essenzialmente che ogni test dovrebbe avere carichi sul minor numero possibile di fattori.

Il soddisfacimento di entrambi i criteri fornisce fattori che possono essere interpretati più facilmente e senza ambiguità. Se un test ha un carico elevato su un fattore e non ha carichi significativi su altri fattori, possiamo imparare qualcosa sulla natura di questo fattore esaminando il contenuto di questo test. Al contrario, se un test ha carichi medi o bassi su sei fattori, allora ci dirà poco sulla natura di nessuno di essi.

Nella fig. 1 mostra chiaramente che dopo la rotazione degli assi delle coordinate, tutti i test verbali (1-5) si trovano lungo o molto vicino all'asse I ", e i test numerici (6-10) sono strettamente raggruppati attorno all'asse II ". I nuovi carichi fattoriali, misurati rispetto agli assi ruotati, sono riportati in tabella. 2. Fattori di carico nella tabella. 2 non hanno valori negativi, ad eccezione di valori trascurabili che sono chiaramente attribuibili ad errori di campionamento. Tutti i test verbali hanno carichi elevati sul fattore I "e praticamente zero - sul fattore II". Le prove numeriche, invece, hanno carichi elevati per il fattore II "e trascurabili per il fattore I". Pertanto, la rotazione degli assi coordinati ha notevolmente semplificato l'identificazione e la denominazione di entrambi i fattori, nonché la descrizione della composizione dei fattori di ciascun test. In pratica, il numero di fattori risulta spesso superiore a due, il che, ovviamente, complica la loro rappresentazione geometrica e l'analisi statistica, ma non cambia l'essenza della procedura considerata.

Tavolo 2

Matrice fattoriale dopo la rotazione

Alcuni ricercatori sono guidati dal modello teorico come principio di rotazione degli assi. Tiene anche conto della persistenza, o conferma, degli stessi fattori in studi eseguiti indipendentemente ma comparabili.

Interpretazione dei fattori. Ricevuta la soluzione fattoriale (o, più semplicemente, la matrice fattoriale) dopo la procedura di rotazione, si può procedere all'interpretazione e alla denominazione dei fattori. Questa fase del lavoro richiede l'intuizione psicologica piuttosto che la formazione statistica. Per comprendere la natura di un particolare fattore, non abbiamo altra scelta che studiare i test che hanno carichi elevati per questo fattore e cercare di trovare processi psicologici comuni per loro. Più test con carichi elevati per questo fattore sono, più facile è rivelarne la natura. Da tavola. 2, ad esempio, è subito chiaro che il fattore I è "verbale, e il fattore II" è numerico. Dato in tabella. I carichi di 2 fattori riflettono anche la correlazione di ciascun test con un fattore.

ANALISI DEI FATTORI

L'idea dell'analisi fattoriale

Quando si studiano oggetti complessi, fenomeni, sistemi, i fattori che determinano le proprietà di questi oggetti sono molto spesso impossibili da misurare direttamente e talvolta anche il loro numero e significato sono sconosciuti. Ma altre grandezze possono essere disponibili per la misurazione, in un modo o nell'altro a seconda dei fattori di nostro interesse. Inoltre, quando l'influenza di un'incognita di nostro interesse si manifesta in più caratteristiche o proprietà misurabili di un oggetto, queste caratteristiche possono rivelare una stretta relazione tra loro e il numero totale di fattori può essere molto inferiore al numero di fattori misurati. variabili.

Per identificare i fattori che determinano le caratteristiche misurate degli oggetti, vengono utilizzati metodi di analisi fattoriale.

Come esempio dell'applicazione dell'analisi fattoriale, si può indicare lo studio dei tratti di personalità sulla base di test psicologici. I tratti della personalità non si prestano alla misurazione diretta. Possono essere giudicati solo dal comportamento di una persona o dalla natura delle risposte alle domande. Per spiegare i risultati degli esperimenti, sono sottoposti all'analisi fattoriale, che ci consente di identificare quelle proprietà personali che influenzano il comportamento di un individuo.
Vari metodi di analisi fattoriale si basano sulla seguente ipotesi: i parametri osservati o misurati sono solo caratteristiche indirette dell'oggetto in esame, in realtà esistono parametri e proprietà interni (nascosti, latenti, non osservati direttamente), il cui numero è piccoli e che determinano i valori dei parametri osservati. Questi parametri interni sono generalmente chiamati fattori.

Lo scopo dell'analisi fattoriale è di concentrare le informazioni iniziali, esprimendo un gran numero delle caratteristiche considerate attraverso un numero minore di caratteristiche interne più capienti del fenomeno, che però non possono essere misurate direttamente.

È stato stabilito che l'isolamento e la successiva osservazione del livello dei fattori comuni consente di rilevare gli stati pre-guasto di un oggetto nelle primissime fasi dello sviluppo del difetto. L'analisi fattoriale consente di monitorare la stabilità delle correlazioni tra i singoli parametri. Sono le correlazioni tra i parametri, nonché tra i parametri e i fattori generali che contengono le principali informazioni diagnostiche sui processi. L'uso degli strumenti del pacchetto Statistica durante l'esecuzione dell'analisi fattoriale elimina la necessità di ulteriori strumenti di calcolo e rende l'analisi chiara e comprensibile per l'utente.

I risultati dell'analisi fattoriale avranno successo se è possibile interpretare i fattori identificati sulla base del significato degli indicatori che caratterizzano questi fattori. Questa fase del lavoro è molto responsabile; richiede una chiara comprensione del significato significativo degli indicatori che sono coinvolti nell'analisi e sulla base dei quali vengono identificati i fattori. Pertanto, nell'attenta selezione preliminare degli indicatori per l'analisi fattoriale, si dovrebbe essere guidati dal loro significato e non dal desiderio di includerne il maggior numero possibile nell'analisi.

L'essenza dell'analisi fattoriale

Ecco alcuni dei punti principali dell'analisi fattoriale. Sia per la matrice NS i parametri misurati dell'oggetto c'è una matrice di covarianza (correlazione) C, dove R- numero di parametri, n- il numero di osservazioni. Per trasformazione lineare X=QY+tu puoi ridurre la dimensione dello spazio fattore originale NS livellare , in cui R"<<R... Ciò corrisponde alla trasformazione del punto che caratterizza lo stato dell'oggetto in J spazio -dimensionale, in un nuovo spazio di dimensioni con una dimensione inferiore R". Ovviamente, la prossimità geometrica di due o di un insieme di punti nel nuovo spazio fattoriale significa la stabilità dello stato dell'oggetto.

Matrice contiene fattori non osservabili, che sono essenzialmente iperparametri che caratterizzano le proprietà più generali dell'oggetto analizzato. I fattori comuni sono spesso scelti per essere statisticamente indipendenti, il che facilita la loro interpretazione fisica. Vettore di segni osservati NS dà un senso alle conseguenze della modifica di questi iperparametri.

Matrice tuè costituito da fattori residui, che includono principalmente errori di misurazione X(io). Matrice rettangolare Q contiene i caricamenti dei fattori che determinano la relazione lineare tra le caratteristiche e gli iperparametri.
I carichi dei fattori sono i valori dei coefficienti di correlazione di ciascuna delle caratteristiche iniziali con ciascuno dei fattori identificati. Più stretta è la relazione di questa caratteristica con il fattore in esame, maggiore è il valore del carico del fattore. Un segno positivo del carico del fattore indica una relazione diretta (e un segno negativo - una relazione inversa) di questo tratto con un fattore.

Pertanto, i dati sui carichi dei fattori consentono di formulare conclusioni sull'insieme delle caratteristiche iniziali che riflettono un particolare fattore e sul peso relativo di una caratteristica individuale nella struttura di ciascun fattore.

Il modello di analisi fattoriale è simile alla regressione multivariata e all'analisi dei modelli della varianza. La differenza fondamentale tra il modello di analisi fattoriale è che il vettore Y è fattori non osservabili, mentre nell'analisi di regressione questi sono parametri registrati. A destra dell'equazione (8.1), le incognite sono la matrice dei carichi fattoriali Q e la matrice dei valori dei fattori comuni Y.

Per trovare la matrice dei carichi fattoriali, utilizzare l'equazione QQ t = S – V, dove Q t è la matrice trasposta Q, V è la matrice di covarianza dei fattori residui U, cioè ... L'equazione viene risolta per iterazioni mentre si specifica un'approssimazione zero della matrice di covarianza V (0). Dopo aver trovato la matrice dei carichi fattoriali Q, i fattori generali (iperparametri) vengono calcolati secondo l'equazione
Y = (Q t V -1) Q -1 Q t V -1 X

Il pacchetto di analisi statistica Statistica consente in modalità interattiva di calcolare la matrice dei carichi dei fattori, nonché i valori di diversi fattori principali predeterminati, molto spesso due, in base ai primi due componenti principali della matrice di parametri originale.

Analisi fattoriale nel sistema Statistica

Consideriamo la sequenza di esecuzione dell'analisi fattoriale usando l'esempio dell'elaborazione dei risultati di un'indagine tramite questionario sui dipendenti di un'impresa. È necessario identificare i principali fattori che determinano la qualità della vita lavorativa.

Nella prima fase, è necessario selezionare le variabili per l'analisi fattoriale. Utilizzando l'analisi della correlazione, il ricercatore cerca di identificare la relazione delle caratteristiche studiate, che a sua volta gli dà l'opportunità di selezionare un insieme di caratteristiche completo e non ridondante combinando caratteristiche fortemente correlate.

Se l'analisi fattoriale viene eseguita per tutte le variabili, i risultati potrebbero non essere del tutto obiettivi, poiché alcune variabili sono determinate da altri dati e non possono essere regolate dai dipendenti dell'organizzazione in questione.

Per capire quali indicatori dovrebbero essere esclusi, costruiremo una matrice di coefficienti di correlazione in Statistica basata sui dati disponibili: Statistiche / Statistiche di base / Matrici di correlazione / Ok. Nella finestra di avvio di questa procedura Prodotto-Momento e Correlazioni Parziali (Fig. 4.3), il pulsante Elenco Una variabile viene utilizzato per calcolare la matrice quadrata. Seleziona tutte le variabili (seleziona tutte), Ok, Riepilogo. Otteniamo la matrice di correlazione.

Se il coefficiente di correlazione cambia nell'intervallo da 0,7 a 1, ciò significa una forte correlazione di indicatori. In questo caso si può escludere una variabile altamente correlata. Al contrario, se il coefficiente di correlazione è piccolo, puoi escludere la variabile perché non aggiunge nulla al totale. Nel nostro caso, non esiste una forte correlazione tra nessuna delle variabili e l'analisi fattoriale verrà eseguita per l'intero set di variabili.

Per eseguire l'analisi fattoriale, è necessario chiamare il modulo Statistiche / Tecniche esplorative multivariate (metodi di ricerca multivariata) / Analisi fattoriale (analisi fattoriale). La finestra del modulo Analisi fattoriale apparirà sullo schermo.



Per l'analisi, selezionare tutte le variabili del foglio di calcolo; Variabili: seleziona tutto, Ok. La riga del file di input indica i dati grezzi. Ci sono due tipi di dati sorgente disponibili nel modulo - Raw Data e Correlation Matrix - una matrice di correlazione.

La sezione Eliminazione MD specifica come gestire i valori mancanti:
* Casewise: un modo per escludere i valori mancanti (per impostazione predefinita);
* Pairwise - un modo pairwise per escludere i valori mancanti;
* Sostituzione media - sostituzione della media invece dei valori mancanti.
Il metodo Casewise è che in un foglio di calcolo che contiene dati, tutte le righe che hanno almeno un valore mancante vengono ignorate. Questo vale per tutte le variabili. Il metodo Pairwise ignora i valori mancanti non per tutte le variabili, ma solo per la coppia selezionata.

Scegliamo un modo per gestire i valori mancanti Casewise.

Statistica elaborerà i valori mancanti nel modo specificato, calcolerà la matrice di correlazione e offrirà una scelta tra diversi metodi di analisi fattoriale.

Dopo aver premuto il pulsante Ok, viene visualizzata la finestra Definisci metodo di estrazione del fattore.

La parte superiore della finestra è informativa. Dice che i valori mancanti sono stati gestiti con il metodo Casewise. Sono state elaborate 17 osservazioni e sono state accettate 17 osservazioni per ulteriori calcoli. La matrice di correlazione viene calcolata per 7 variabili. La parte inferiore della finestra contiene 3 schede: Veloce, Avanzate, Descrittive.

La scheda Descrittive ha due pulsanti:
1- visualizzare correlazioni, medie e deviazioni standard;
2- costruire regressioni multiple.

Cliccando sul primo pulsante, puoi vedere la media e le deviazioni standard, le correlazioni, la covarianza, costruire vari grafici e istogrammi.

Nella scheda Avanzate, a sinistra, selezionare il metodo di estrazione dell'analisi fattoriale: Componenti principali. Sul lato destro, seleziona il numero massimo di fattori (2). Viene impostato il numero massimo di fattori (Numero massimo di fattori) o l'autovalore minimo: 1 (autovalore).

Fare clic su Ok e Statistica eseguirà i calcoli rapidamente. Viene visualizzata la finestra Risultati analisi fattoriale. Come accennato in precedenza, i risultati dell'analisi fattoriale sono espressi da un insieme di carichi fattoriali. Pertanto, lavoreremo ulteriormente con la scheda Caricamenti.

La parte superiore della finestra è informativa:
Numero di variabili: 7;
Metodo (metodo di identificazione dei fattori): Componenti principali;
Log (10) determinante della matrice di correlazione: –1.6248;
Numero di fattori estratti: 2;
Autovalori: 3.39786 e 1.19130.
Nella parte inferiore della finestra sono presenti pulsanti funzionali che consentono di visualizzare in modo completo i risultati dell'analisi, numericamente e graficamente.
Rotazione dei fattori - rotazione dei fattori, in questa casella a discesa è possibile selezionare diverse rotazioni degli assi. Ruotando il sistema di coordinate è possibile ottenere un insieme di soluzioni, da cui è necessario scegliere una soluzione interpretata.

Esistono vari metodi per ruotare le coordinate dello spazio. Statistica offre otto di questi metodi, presentati nel modulo Analisi fattoriale. Quindi, ad esempio, il metodo varimax corrisponde a una trasformazione di coordinate: una rotazione che massimizza la varianza. Nel metodo varimax, si ottiene una descrizione semplificata delle colonne della matrice dei fattori, riducendo tutti i valori a 1 o 0. In questo caso viene considerata la varianza dei quadrati dei carichi dei fattori. La matrice dei fattori ottenuta utilizzando il metodo di rotazione varimax è più invariante rispetto alla scelta di diversi insiemi di variabili.

La rotazione con il metodo quartimax mira ad un'analoga semplificazione solo in relazione alle righe della matrice dei fattori. Equimax occupa una posizione intermedia? i fattori di rotazione con questo metodo tentano contemporaneamente di semplificare sia le colonne che le righe. I metodi di rotazione considerati si riferiscono a rotazioni ortogonali, ovvero il risultato sono fattori non correlati. I metodi di rotazione diretta oblimin e promax si riferiscono a rotazioni oblique, che risultano in fattori correlati. Il termine?normalizzato? nei nomi dei metodi indica che i carichi dei fattori sono normalizzati, cioè sono divisi per la radice quadrata della varianza corrispondente.

Di tutti i metodi proposti, esamineremo prima il risultato dell'analisi senza ruotare il sistema di coordinate - Non ruotato. Se il risultato ottenuto risulta interpretabile e ci si addice, allora possiamo fermarci a questo. In caso contrario, puoi ruotare gli assi e vedere altre soluzioni.

Fare clic sul pulsante "Caricamento del fattore" e guardare i caricamenti dei fattori numericamente.



Ricordiamo che i caricamenti dei fattori sono i valori dei coefficienti di correlazione di ciascuna delle variabili con ciascuno dei fattori identificati.

Il valore del carico del fattore maggiore di 0,7 mostra che questo segno o variabile è strettamente correlato al fattore in esame. Più stretta è la relazione di questa caratteristica con il fattore in esame, maggiore è il valore del carico del fattore. Un segno positivo del carico del fattore indica una relazione diretta (e un segno negativo - una relazione inversa) tra questo tratto e il fattore.
Quindi, dalla tabella dei carichi fattoriali, sono stati identificati due fattori. Il primo definisce RSD - un senso di benessere sociale. Il resto delle variabili è dovuto al secondo fattore.

La linea Espl. Var (Fig. 8.5) mostra la varianza per un particolare fattore. La linea Prp. Totl mostra la proporzione di varianza attribuibile al primo e al secondo fattore. Di conseguenza, il primo fattore rappresenta il 48,5% della varianza totale e il secondo fattore - 17,0% della varianza totale, tutto il resto ricade su altri fattori non contabilizzati. Di conseguenza, due fattori identificati spiegano il 65,5% della varianza totale.



Qui vediamo anche due gruppi di fattori - OSB e il resto dell'insieme di variabili, tra cui spicca la ZSR - il desiderio di cambiare lavoro. Apparentemente, ha senso indagare più a fondo questo desiderio sulla base della raccolta di dati aggiuntivi.

Selezione e affinamento del numero di fattori

Una volta che sai quanta varianza ha identificato ciascun fattore, puoi tornare alla domanda su quanti fattori dovrebbero essere mantenuti. Per sua stessa natura, questa decisione è arbitraria. Ma ci sono alcune linee guida comuni e, in pratica, seguirle dà i migliori risultati.

Il numero di fattori comuni (iperparametri) è determinato calcolando gli autovalori (Fig. 8.7) della matrice X nel modulo di analisi fattoriale. Per fare ciò, nella scheda Varianza spiegata (Fig. 8.4), fare clic sul pulsante Scree plot.


Il numero massimo di fattori comuni può essere uguale al numero di autovalori della matrice dei parametri. Ma con un aumento del numero di fattori, le difficoltà della loro interpretazione fisica aumentano in modo significativo.

Innanzitutto, puoi selezionare solo fattori con autovalori maggiori di 1. In sostanza, ciò significa che se un fattore non seleziona una varianza equivalente almeno alla varianza di una variabile, allora viene omesso. Questo è il criterio più utilizzato. Nell'esempio sopra, in base a questo criterio, dovrebbero essere mantenuti solo 2 fattori (due componenti principali).

Puoi trovare un posto sul grafico in cui la diminuzione degli autovalori da sinistra a destra rallenta il più possibile. Si presume che solo l'"astragalo fattoriale" si trovi a destra di questo punto. Secondo questo criterio, nell'esempio possono essere lasciati 2 o 3 fattori.
Fico. si può notare che il terzo fattore aumenta in modo insignificante la quota della varianza totale.

L'analisi fattoriale dei parametri consente di rilevare in una fase iniziale una violazione del processo di lavoro (il verificarsi di un difetto) in vari oggetti, che spesso è impossibile notare dall'osservazione diretta dei parametri. Ciò è dovuto al fatto che la violazione delle correlazioni tra i parametri si verifica molto prima della modifica di un parametro. Tale distorsione delle correlazioni consente il rilevamento tempestivo dell'analisi fattoriale dei parametri. Per fare ciò, è sufficiente disporre di array di parametri registrati.

È possibile fornire raccomandazioni generali sull'uso dell'analisi fattoriale, indipendentemente dall'area tematica.
* Ogni fattore deve avere almeno due parametri misurati.
* Il numero di misurazioni dei parametri deve essere maggiore del numero di variabili.
* Il numero di fattori dovrebbe essere giustificato in base all'interpretazione fisica del processo.
* Cerca sempre di garantire che il numero di fattori sia molto inferiore al numero di variabili.

Il criterio Kaiser a volte conserva troppi fattori, mentre il criterio ghiaione a volte ne conserva troppo pochi. Tuttavia, entrambi i criteri sono abbastanza buoni in condizioni normali quando ci sono relativamente pochi fattori e molte variabili. In pratica, la domanda più importante è quando la soluzione risultante può essere interpretata. Pertanto, di solito vengono studiate diverse soluzioni con più o meno fattori e quindi viene selezionata una delle più significative.

Lo spazio delle caratteristiche originarie dovrebbe essere rappresentato in scale di misura omogenee, poiché ciò consente l'utilizzo di matrici di correlazione nel calcolo. Diversamente si pone il problema dei "pesi" dei vari parametri, che porta alla necessità di utilizzare nel calcolo matrici di covarianza. Quindi, un ulteriore problema di ripetibilità dei risultati dell'analisi fattoriale può apparire quando il numero di caratteristiche cambia. Va notato che questo problema viene semplicemente risolto nel pacchetto Statistica passando a una forma standardizzata di rappresentazione dei parametri. In questo caso, tutti i parametri diventano equivalenti nel grado della loro connessione con i processi oggetto di ricerca.

Matrici poco condizionate

Se sono presenti variabili ridondanti nell'insieme di dati iniziale e non sono state eliminate dall'analisi di correlazione, non è possibile calcolare la matrice inversa (8.3). Ad esempio, se una variabile è la somma di altre due variabili selezionate per questa analisi, la matrice di correlazione per quell'insieme di variabili non può essere invertita e fondamentalmente non può essere eseguita l'analisi fattoriale. In pratica, ciò accade quando si cerca di applicare l'analisi fattoriale a un insieme di variabili altamente dipendenti, cosa che talvolta avviene, ad esempio, nell'elaborazione dei questionari. Quindi puoi abbassare artificialmente tutte le correlazioni nella matrice aggiungendo una piccola costante agli elementi diagonali della matrice e quindi standardizzarla. Questa procedura di solito si traduce in una matrice che può essere invertita e quindi l'analisi fattoriale può essere applicata ad essa. Inoltre, questa procedura non influisce sull'insieme dei fattori, ma le stime sono meno accurate.

Modellazione fattoriale e di regressione di sistemi a variabili di stato

Un sistema a stati variabili (SPS) è un sistema la cui risposta dipende non solo dall'azione in ingresso, ma anche da una costante generalizzata nel parametro temporale che ne determina lo stato. Amplificatore variabile o attenuatore? questo è un esempio della PCA più semplice, in cui il coefficiente di trasmissione può essere modificato in modo discreto o uniforme secondo alcune leggi. Lo studio dell'SPS viene solitamente effettuato per modelli linearizzati in cui il processo transitorio associato ad una variazione del parametro di stato è considerato completo.

I più diffusi sono gli attenuatori realizzati sulla base di connessioni a forma di L, T e U in serie e in diodi collegati in parallelo. La resistenza dei diodi sotto l'influenza della corrente di controllo può variare in un ampio intervallo, il che rende possibile modificare la risposta in frequenza e l'attenuazione nel percorso. L'indipendenza dello sfasamento durante la regolazione dello smorzamento in tali attenuatori si ottiene utilizzando circuiti reattivi inclusi nella struttura di base. Ovviamente con un diverso rapporto delle resistenze dei diodi in parallelo e in serie si può ottenere lo stesso livello di attenuazione di inserzione. Ma il cambiamento di sfasamento sarà diverso.

Indaghiamo la possibilità di semplificare la progettazione automatizzata degli attenuatori, che esclude la doppia ottimizzazione dei circuiti di correzione e dei parametri degli elementi controllati. Useremo un attenuatore controllato elettricamente come SPS indagato, il cui circuito equivalente è mostrato in Fig. 8.8. Il livello minimo di attenuazione è previsto nel caso di una resistenza dell'elemento Rs bassa e una resistenza dell'elemento grande Rp. All'aumentare della resistenza dell'elemento Rs e alla diminuzione della resistenza dell'elemento Rp, aumenta l'attenuazione introdotta.

Le dipendenze del cambiamento nello sfasamento dalla frequenza e dall'attenuazione per il circuito senza correzione e con correzione sono mostrate in Fig. 8.9 e 8.10 rispettivamente. Nell'attenuatore corretto nell'intervallo di attenuazione di 1,3-7,7 dB e nella banda di frequenza di 0,01-4,0 GHz, è stata ottenuta una variazione dello sfasamento non superiore a 0,2 °. In un attenuatore senza correzione, la variazione dello sfasamento nella stessa banda di frequenza e gamma di attenuazione raggiunge i 3 °. Pertanto, lo sfasamento viene ridotto di quasi 15 volte a causa della correzione.


Considereremo i parametri di correzione e controllo come variabili o fattori indipendenti che influenzano l'attenuazione e la variazione dello sfasamento. Ciò consente, utilizzando il sistema Statistica, di effettuare analisi fattoriali e di regressione dell'SPS al fine di stabilire regolarità fisiche tra i parametri del circuito e le caratteristiche individuali, nonché di semplificare la ricerca dei parametri ottimali del circuito.

I dati iniziali sono stati formati come segue. Per i parametri di correzione e le resistenze di controllo differenti da quelli ottimali up e down su una griglia di frequenza di 0,01--4 GHz, sono state calcolate l'attenuazione di inserzione e la variazione dello sfasamento.

I metodi di modellazione statistica, in particolare l'analisi fattoriale e di regressione, che non erano precedentemente utilizzati per la progettazione di dispositivi discreti con stati variabili, consentono di identificare i modelli fisici del funzionamento degli elementi del sistema. Ciò contribuisce alla creazione della struttura del dispositivo basata su un determinato criterio di ottimalità. In particolare, questa sezione ha considerato un attenuatore invariante di fase come un tipico esempio di sistema a variabile di stato. L'identificazione e l'interpretazione dei carichi fattoriali che influenzano le varie caratteristiche oggetto di studio consente di modificare la metodologia tradizionale e semplificare notevolmente la ricerca dei parametri di correzione e dei parametri di controllo.

È stato stabilito che l'uso di un approccio statistico alla progettazione di tali dispositivi è giustificato sia per valutare la fisica del loro funzionamento sia per convalidare i diagrammi schematici. La modellazione statistica può ridurre significativamente la quantità di ricerca sperimentale.

risultati

  • L'osservazione dei fattori comuni e dei corrispondenti fattori di carico è un'identificazione necessaria dei modelli interni dei processi.
  • Per determinare i valori critici delle distanze controllate tra i carichi fattoriali, è necessario accumulare e generalizzare i risultati dell'analisi fattoriale per processi dello stesso tipo.
  • L'applicazione dell'analisi fattoriale non si limita alle caratteristiche fisiche dei processi. L'analisi fattoriale è un potente metodo per monitorare i processi ed è applicabile alla progettazione di sistemi per un'ampia varietà di scopi.

FASI PER EFFETTUARE L'ANALISI FATTORIALE

Ci sono nove fasi dell'analisi fattoriale. Per chiarezza, presenteremo queste fasi nel diagramma e poi daremo loro una breve descrizione.

Le fasi di esecuzione dell'analisi fattoriale sono mostrate in Fig.

Riso.

FORMULAZIONE DEL PROBLEMA E COSTRUZIONE DELLA MATRICE DI CORRELAZIONE

Formulazione del problema.È necessario definire chiaramente gli obiettivi dell'analisi fattoriale. Le variabili sottoposte ad analisi fattoriale sono impostate in base a ricerche passate, calcoli teorici oa discrezione del ricercatore. È necessario che le variabili siano misurate in intervallo o parente scala. L'esperienza mostra che la dimensione del campione dovrebbe essere da quattro a cinque volte maggiore del numero di variabili.

Costruire una matrice di correlazione. L'analisi si basa su una matrice di correlazione tra le variabili. La fattibilità dell'analisi fattoriale è determinata dalla presenza di correlazioni tra le variabili. Se le correlazioni tra tutte le variabili sono piccole, l'analisi fattoriale è inutile. Le variabili che sono strettamente correlate tra loro tendono ad essere strettamente correlate con lo stesso fattore o fattori.

Sono disponibili diverse statistiche per testare la fattibilità dell'utilizzo del modello fattoriale. Il criterio di sfericità di Bartlett viene utilizzato per verificare l'ipotesi nulla che non vi sia alcuna correlazione tra le variabili nella popolazione generale. Ciò significa che stiamo considerando l'affermazione che la matrice di correlazione della popolazione è una matrice identità in cui tutti gli elementi diagonali sono uguali a uno e tutti gli altri sono uguali a zero. Il test di sfericità si basa sulla trasformazione del determinante della matrice di correlazione in una statistica chi-quadrato. Se la statistica è grande, l'ipotesi nulla viene rifiutata. Se l'ipotesi nulla non viene rifiutata, l'analisi fattoriale non è pratica. Un'altra statistica utile è il criterio di campionamento di Kaiser-Meyer-Olkin (KMO). Questo coefficiente confronta i valori dei coefficienti di correlazione osservati con i valori dei coefficienti di correlazione parziale. Piccoli valori delle statistiche CMO indicano che le correlazioni tra coppie di variabili non possono essere spiegate da altre variabili, il che significa che l'uso dell'analisi fattoriale non è pratico.

In generale, sono necessari diversi fattori per spiegare la matrice di correlazione. Ogni fattore è caratterizzato da una colonna , ogni variabile è una stringa di matrice. Il fattore si chiama generale, se tutti i suoi carichi sono significativamente diversi da zero e ha carichi da tutte le variabili. Il fattore generale ha carichi da tutte le variabili e tale fattore è schematicamente mostrato in Fig. 1. colonna Il fattore è chiamato Comune se almeno due dei suoi carichi differiscono significativamente da zero. Colonne, su Riso. 1. rappresentano tali fattori comuni. Hanno carichi di più di due variabili. Se un fattore ha un solo carico, significativamente diverso da zero, allora viene chiamato fattore caratteristico(vedi colonne su Riso. 1.). Ciascuno di tali fattori rappresenta una sola variabile. I fattori comuni sono fondamentali nell'analisi fattoriale. Se vengono stabiliti fattori comuni, i fattori caratteristici vengono ottenuti automaticamente. Viene chiamato il numero di carichi elevati di una variabile su fattori comuni complessità... Ad esempio, una variabile su Fig. 1. ha una complessità di 2 e una variabile ha una complessità di tre.

Riso. 1. Rappresentazione schematica della mappatura fattoriale. Una croce indica un carico ad alto fattore.

Quindi costruiamo un modello

, (4)

dove sono i fattori non osservabili m< K,

Variabili osservabili (caratteristiche di base),

Carichi fattoriali,

Errore casuale relativo solo a media e varianza zero:

E - non correlato,

Variabili casuali non correlate con media nulla e varianza unitaria .

(5)

Qui - io-esima comunanza che rappresenta la parte della varianza dovuta ai fattori - la parte della varianza dovuta all'errore. Nella notazione matriciale, il modello fattoriale assumerà la forma:

(6)

dove è la matrice dei carichi, è il vettore dei fattori, è il vettore degli errori.

Le correlazioni tra le variabili espresse dai fattori possono essere dedotte come segue:

dove - la matrice di ordine diagonale contenente le varianze degli errori [i]. Condizione principale: - diagonale, - matrice definita non negativa. Un'ulteriore condizione per l'unicità della soluzione è la diagonalità della matrice.

Esistono molti metodi per risolvere l'equazione fattoriale. Il primo metodo di analisi fattoriale è metodo del fattore principale, in cui la tecnica di analisi delle componenti principali viene utilizzata in relazione a una matrice di correlazione ridotta con generalità sulla diagonale principale. Per valutare la comunanza si usa solitamente il coefficiente di correlazione multipla tra la variabile corrispondente e l'insieme delle altre variabili.

L'analisi fattoriale viene eseguita sulla base dell'equazione caratteristica, come nell'analisi dei componenti principali:

(8)

Risolvendo che, si ottengono gli autovalori λ i e la matrice dei vettori normalizzati (caratteristici) V, e quindi si trova la matrice della mappatura dei fattori:

Per ottenere stime delle generalità e dei carichi fattoriali, viene utilizzato un algoritmo iterativo empirico che converge a stime vere dei parametri. L'essenza dell'algoritmo è la seguente: le stime iniziali dei carichi dei fattori sono determinate utilizzando il metodo dei fattori principali. Sulla base della matrice di correlazione R, vengono formalmente determinate le stime delle componenti principali e dei fattori generali:

(9)

dove è il corrispondente autovalore della matrice R;

Dati di origine (vettori di colonna);

Coefficienti per fattori comuni;

Componenti principali (vettori colonna).

I carichi dei fattori sono stimati dai valori

Le stime della comunità sono ottenute come

All'iterazione successiva viene modificata la matrice R - al posto degli elementi della diagonale principale vengono sostituite le stime di comunità ottenute all'iterazione precedente; sulla base della matrice R modificata utilizzando lo schema computazionale dell'analisi delle componenti, si ripete il calcolo delle componenti principali (che non sono tali dal punto di vista dell'analisi delle componenti), stime dei fattori principali, carichi fattoriali, generalità, e si cercano le specificità. L'analisi fattoriale può essere considerata completa quando le stime dei punti in comune cambiano debolmente a due iterazioni adiacenti.

Nota. Le trasformazioni della matrice R possono violare la determinatezza positiva della matrice R + e, di conseguenza, alcuni autovalori di R + possono essere negativi.

Pubblicazioni correlate