Comment puis-je calculer ces statistiques?

voix
12

J'écris une application pour faciliter une recherche, et une partie de cela implique de faire quelques calculs statistiques. En ce moment, les chercheurs utilisent un programme appelé SPSS . Une partie de la production qu'ils se soucient de se présente comme suit:

[Une

Ils sont vraiment seulement préoccupés par la Fet les Sig.valeurs. Mon problème est que je n'ai pas de fond dans les statistiques, et je ne peux pas comprendre ce que les tests sont appelés, ou comment les calculer.

Je pensais que la Fvaleur pourrait être le résultat du test F , mais après avoir suivi les étapes données sur Wikipedia, je suis arrivé un résultat qui était différent de ce qui SPSSdonne.

Créé 04/08/2008 à 23:56
source utilisateur
Dans d'autres langues...                            


6 réponses

voix
4

Ce site peut vous aider un peu plus. Aussi celui - ci .

Je travaille à partir d'une mémoire assez rouillée d'un cours de statistique, mais rien ne se passe ici:

Lorsque vous faites une analyse de variance (Anova), on calcule en fait la statistique F comme le rapport des écarts moyens carrés « entre les groupes » et les écarts moyens carrés « au sein des groupes ». Le deuxième lien ci-dessus semble assez bon pour ce calcul.

Cela rend la mesure statistique F exactement la puissance de votre modèle est, parce que la variance est un pouvoir explicatif, et la variance « au sein des groupes » « entre les groupes » est une erreur aléatoire. F élevée implique un modèle très significatif.

Comme dans de nombreuses opérations statistiques, vous back-déterminer Sig. en utilisant la statistique F. Voici où vos informations de Wikipedia est légèrement à portée de main. Qu'est - ce que vous voulez faire est - en utilisant les degrés de liberté que vous donne SPSS - trouver la bonne valeur P au cours de laquelle un tableau F vous donnera la statistique F que vous avez calculé. La valeur de P où cela se produit [F (tableau) = F (calculé)] est la signification.

Conceptuellement, une valeur de signification inférieure montre une très forte capacité de rejeter l'hypothèse nulle (ce qui signifie à ces fins pour déterminer votre modèle a le pouvoir explicatif).

Désolé pour les gens de mathématiques si tout cela est faux. Je vais vérifier de nouveau pour effectuer des modifications !!!

Bonne chance à toi. Stats est amusant, juste peut-être pas cette partie. =)

Créé 05/08/2008 à 00:32
source utilisateur

voix
3

Je suppose que de votre question que vos collègues de recherche à automatiser le processus par lequel certaines analyses statistiques sont effectuées (par exemple, ils veulent des ensembles de données de traitement par lots). Vous avez deux options:

1) SPSS est scriptées par python (de la version 15) - aller à la spss.com et la recherche de python. Vous pouvez écrire des scripts Python pour automatiser l'analyse des données et extraire des valeurs clés de tableaux croisés dynamiques et traiter ensuite les réponses comme vous le souhaitez. Cela a la vertu de permettre une comparaison exacte entre les résultats de votre script python et les efforts calculés à la main dans SPSS de vos collaborateurs. Ainsi, vous ne devez savoir vraiment de statistiques pour faire ce travail (ce qui est un avantage clé)

2) Vous pouvez le faire en R, un environnement statistique libre, ce qui pourrait probablement être scénarisé. Ceci a pour inconvénient que vous devrez apprendre des statistiques pour vous assurer que vous le faites correctement.

Créé 22/09/2008 à 04:29
source utilisateur

voix
2

En bref: ne pas le faire à la main, lien / utilisation des logiciels existants. Et la réponse de sain_grocen est incorrecte. :(

Ce sont tous les tests de signification des estimations des paramètres qui sont généralement utilisés dans multivariée de réponse de régression multiple. Ceux-ci ne seraient pas des choses simples à faire en dehors d'un environnement de programmation statistique. Je suggère soit obtenir la sortie d'un programme statistique préexistant, ou d'utiliser un que vous pouvez lier et utiliser ce code.

Je crains que la première réponse (des années sain_grocen) vous mènera sur le mauvais chemin. Son explication est sans doute d'un cas particulier de ce que vous êtes réellement affaire. Le ANOVA a expliqué dans ses liens est pour une seule réponse variate, dans un design équilibré. Ce ne sont pas les statistiques F que vous voyez. Les noms de votre sortie (la Trace de Pillai, Trace Hotelling, ...) sont quelques-unes des versions à plusieurs variables disponibles. Ils ont des distributions F sous certaines hypothèses. Je ne peux pas expliquer les livres de texte valeur de matériel ici, je vous conseille de commencer par regarder « appliquée Analyse statistique multivariée » par Johnson et Wichern

Créé 17/09/2008 à 00:17
source utilisateur

voix
2

Statistiques est difficile :-). Après une année de lecture et des livres et des documents relisant et ne peut dire avec confiance que je comprends les bases de celui-ci.

Vous pouvez étudier les bibliothèques prêtes à fait pour la langue que la programmation que vous utilisez, car ils sont beaucoup de gotcha en mathématiques en général et en particulier des statistiques (erreurs d'arrondi étant un exemple évident).

À titre d'exemple , vous pouvez jeter un oeil au projet de R , qui est à la fois un environnement interactif et une bibliothèque que vous pouvez utiliser à partir de votre code C ++, distribué sous licence GPL (si vous utilisez seulement en interne et ne publier que les résultats, vous n'avez pas besoin d'ouvrir votre code).

Créé 18/08/2008 à 07:01
source utilisateur

voix
0

Voici une explication de MANOVA ouptput, d'un très bon site sur les statistiques et sur SPSS:

Sortie avec l' explication: http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm

Comment et pourquoi faire GLM MANOVA ou à plusieurs variables: (même chemin que ci-dessus, mais se terminant par « /manova.htm »)

logiciel d'écriture à partir de zéro pour calculer ces sorties seraient à la fois longue et difficile; il y a beaucoup de problèmes numériques et de la matrice inversions à faire.

Comme Henry dit, utiliser des scripts Python ou R. Je vous suggère de travailler avec quelqu'un qui sait SPSS si le script. En outre, SPSS est lui-même capable d'exporter les tables de sortie vers des fichiers en utilisant quelque chose appelé OMS. Un script au sein de SPSS peut le faire.

Découvrez qui dans votre groupe de recherche sait SPSS et travailler avec eux.

Créé 22/12/2009 à 02:56
source utilisateur

voix
0

Pouvez-vous expliquer plus pourquoi SPSS est lui-même pas une solution bien au problème? Est-ce qu'il génère des tableaux croisés dynamiques en sortie qui sont difficiles à manipuler? Est-ce le coût du programme?

F-statistiques peuvent provenir de tout nombre de tests particuliers. Le F est juste une distribution (vaguement: une description des « fréquences » des groupes de valeurs), comme un ou uniforme normal (gaussienne). En général , ils proviennent de rapports des écarts. Avis: de nombreux statisticiens (moi y compris), trouver des tests basés sur F instable (jargon: non robuste ).

Les statistiques de production particulières (l'état de trace de Pillai, etc.) donnent à penser que l'analyse initiale est un exemple MANOVA, qui comme d'autres décrivent est une question complexe et difficile à obtenir la bonne procédure.

Je suis suppose aussi que, sur la base du MANOVA, et l'utilisation de SPSS, c'est un projet de psychologie ou la sociologie ... sinon s'il vous plaît éclairer. Il se pourrait que d'autres modèles plus simples pourraient être plus facile à comprendre et plus reproductible. Consultez votre université locale groupe de consultation statistique, si vous en avez un.

Bonne chance!

Créé 17/09/2008 à 14:48
source utilisateur

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more