Videos streaming images jeux et buzz
Connexion






Perdu le mot de passe ?

Inscrivez-vous maintenant !
Menu Principal
Communauté




Galora
Recherche du prix Nobel de statistiques
 0  #1
Je poste trop
Inscrit: 31/07/2008 19:53
Post(s): 11575
Karma: 864
J'hésitais à poser ça ici ou dans le bar, mais je recherche une personne vraiment calée en stat. pour m'aider 😃.
Mtn on peut faire de ce topic un topic général de stat pour poser toutes nos questions, ça serait pas mal non plus^^

Alors j'ai un gros problème avec une analyse de données.

En gros j'ai une dizaine de sujet et une variable intra à deux niveaux, tout con jusqu'ici. Le truc c'est que dans ma variable intra j'ai des centaines de valeurs qui sont mes variables dépendantes donc que je cherche à analyser.

Je récapitule donc avec 3 sujets
....Etat1.....Etat2
1.....2.......3
2.....4.......4
3.....3.......4
.
.


Mais donc ces valeurs correspondent à des centaines de données.
En réalité si je développe j'ai
....Etat1.....Etat2
1.....1.......5
1.....4.......4
1.....3.......3
1.....4.......5
1.....2.......3
...
2.....4.......4
...

Et donc j'aimerais faire analyser des échantillons appariés et vu mes données je suis obligé de faire un test non-paramétrique.

Je me retrouve donc à devoir faire un Wilcoxon, jusqu'ici aucun problème.

MAIS

En réalité toutes ces données correspondent à des fréquences cardiaques au dixième de seconde. Et le but tout con c'est de voir les différences de fréquances cardiaques entre état 1 et état 2.
Le problème c'est que je me retrouve avec plein de données identiques puisque je devais avoir une précision au dixième de seconde avec une fréquence qui est de l'ordre de 1-2 secondes et donc toutes mes données sont en réalités (souvent MAIS PAS TOUJOURS (donc je peux pas bêtement diviser )) du genre
35,94967046
35,94967046
35,94967046
35,94967046
35,94967046
35,94967046
35,94967046
35,94967046
35,94967046
35,94967046
35,94967046
35,94967046
35,94967046
35,94967046
35,94967046

Ce qui fait que quand je fais mon Wilcoxon bat c'est constamment significatif parce que je divise par un nombre énorme (toutes mes données répétées) et ma p valeur est ridiculement petite.

Pour vous donner un exemple concret



et donc je me retrouve avec ça


Une p valeur de porc alors qu'on voit bien aux moyennes que c'est bidon c'est juste que j'ai tellement de valeurs identiques que ça devient significatif :lol:

Et donc voilà, vous avez pas une idée ? Un truc qui permet de corriger ce type d'erreur. On m'a dit "cherche dans des bouquins de stats" ... super je trouve que dalle.

Là je suis sous SPSS et je trouve pas l'option "jtesauvelavie" 😢, je peux aussi utiliser Rstudio, Statview, Statistica.

Merciii :coeur:

Contribution le : 24/11/2015 15:45
Signaler

SonyDian
 0  #2
Je masterise !
Inscrit: 03/03/2009 22:44
Post(s): 4787
Karma: 3671
Ce n'est pas sous SPSS que tu doit te mettre mais sous VA avant qu'on soit obliger de te faire une RCP et la "jtesauvelavie" 😉

Contribution le : 24/11/2015 15:56
Signaler

Zertyy
 0  #3
Serial Locker
Inscrit: 22/01/2007 23:42
Post(s): 19081
Karma: 5721
Mais si un jour tu cherches des Stats sur la pâtisserie/boulangerie je serais ton homme, mais là, non 😃

Contribution le : 24/11/2015 19:21
Signaler

Kilroy1
 0  #4
Je poste trop
Inscrit: 09/10/2011 11:09
Post(s): 19506
Karma: 24961
Pareil sans moi:-o 😃

Contribution le : 24/11/2015 21:26
Signaler

 0  #5
Fantôme
Je continue le cortège des "infoutus de t'aider" !

J'ai déjà mal au crâne en lisant tes quelques lignes !
Mon pauvre Galora !:-o

Courage, mec !!


Contribution le : 25/11/2015 09:08
Signaler

Asmodeus
 0  #6
Je masterise !
Inscrit: 19/02/2014 16:35
Post(s): 2113
Karma: 1085
@Galora Je n'ai vraiment pas compris pourquoi les données étaaient identiques (surtout que sur ton exemple, tu as une précision de 8 chiffres après la virgule).

Contribution le : 25/11/2015 09:18
Signaler

Galora
 0  #7
Je poste trop
Inscrit: 31/07/2008 19:53
Post(s): 11575
Karma: 864
Citation :

@Asmodeus a écrit:
@Galora Je n'ai vraiment pas compris pourquoi les données étaaient identiques (surtout que sur ton exemple, tu as une précision de 8 chiffres après la virgule).


Parce que c'est la fréquence cardiaque au dixième de seconde.

Au lieu d'avoir par exemple
0:00:00.9 - 35 bpm
0:00:02.7 - 35
0:00:04.4 - 34

on a une valeur tous les dixièmes de secondes qui a été trouvées grâce à des transformations et qui convient mieux pour d'autres calculs qui ont été faits.

De toute façon là n'est pas le problème, j'aimerais juste trouver qqchose qui puisse corriger l'erreur lier à un trop grand nombres de données identiques et redondantes.

Contribution le : 25/11/2015 09:40
Signaler

Asmodeus
 0  #8
Je masterise !
Inscrit: 19/02/2014 16:35
Post(s): 2113
Karma: 1085
@Galora Je pense qu'au contraire, le problème est là. Je ne pense pas qu'il existe une méthode rigoureuse pour enlever les valeurs redondantes, tout simplement parce qu'il n'y a pas de méthode théorique qui permet de détecter qu'une valeur redondante est inutile.

Il faut corriger le problème en changeant tes données de manière à en faire des données non redondantes. Ce ne sont donc pas ces données qu'il faut utiliser, tu peux utiliser par exemple le temps qu'il y a entre chaque battement et le suivant. Si tu n'as pas directement cette donnée, ceci peut se faire proabablemet simplement en comptant le nombre d'échantillons successifs identiques en considérant que la probabilité que la fréquence reste rigoureusement la même à chaque battement est nulle (ce qui devrait être le cas). Si tu fais ça, tu auras de nouvelles données, qui à mon avis se comporteraient beaucoup mieux (beaucoup plus proches d'une gaussienne) et qui ne se répèteront pas.

P.S. par ailleurs, si je peux me permettre, il faut formuler les questions de manière rigoureuse, par exemple, quand tu dis " fréquence qui est de l'ordre de 1-2 secondes " tu sais bien que les fréquences ne se comptent pas en secondes. La plupart du temps on peut corriger ça mentalement, mais parfois ça sème la confusion. C'est ce qui m'a donné du mal à comprendre que 35 était une fréquence cardiaque en bpm (c'est quel animal ça ?).

Contribution le : 25/11/2015 10:55
Signaler

Galora
 0  #9
Je poste trop
Inscrit: 31/07/2008 19:53
Post(s): 11575
Karma: 864
Citation :

@Asmodeus a écrit:
@Galora

Il faut corriger le problème en changeant tes données de manière à en faire des données non redondantes.


C'est ce que je redoutais... ce n'est pas moi qui ai créé ces données, au moment où j'ai vu ça et la méthode employée je m'étais déjà dit "oulala, ça va être le bordel à analyser" 😃

C'est des chevaux^^

Contribution le : 25/11/2015 11:12
Signaler

Nakedgirl
 0  #10
J'aime glander ici
Inscrit: 07/03/2007 11:10
Post(s): 5339
Karma: 1455
@Galora

Tu peux pas faire des moyennes et changer l'unité de tes données ?

Contribution le : 25/11/2015 11:31
Signaler

Galora
 0  #11
Je poste trop
Inscrit: 31/07/2008 19:53
Post(s): 11575
Karma: 864
Citation :

@Nakedgirl a écrit:
@Galora

Tu peux pas faire des moyennes et changer l'unité de tes données ?


Faire un wilcoxon sur des moyennes, c'est la solution du pauvre, pas super rigoureux 😃

Contribution le : 25/11/2015 11:54
Signaler

Asmodeus
 0  #12
Je masterise !
Inscrit: 19/02/2014 16:35
Post(s): 2113
Karma: 1085
Citation :

@Galora a écrit:

C'est ce que je redoutais... ce n'est pas moi qui ai créé ces données, au moment où j'ai vu ça et la méthode employée je m'étais déjà dit "oulala, ça va être le bordel à analyser" 😃


Mais tu peux extraire les données que je t'ai proposées à partir des données que tu as. Sauf si je n'ai rien compris.

Tu comptes le temps qu'il y a entre deux battements, et ça tu le connais avec le nombre d'échantillons successifs identiques. ça ne marche pas ?

Contribution le : 25/11/2015 18:11
Signaler

Galora
 0  #13
Je poste trop
Inscrit: 31/07/2008 19:53
Post(s): 11575
Karma: 864
Citation :

@Asmodeus a écrit:


Mais tu peux extraire les données que je t'ai proposées à partir des données que tu as. Sauf si je n'ai rien compris.

Tu comptes le temps qu'il y a entre deux battements, et ça tu le connais avec le nombre d'échantillons successifs identiques. ça ne marche pas ?


Si, mais là on revient au point de départ, et j'ai fait toutes les synchro et tout avec mes données. En gros, je pourrais faire comme tu dis mais je n'ai plus le temps 😃

Contribution le : 25/11/2015 18:27
Signaler

Poum45
 0  #14
Je poste trop
Inscrit: 03/12/2007 23:03
Post(s): 59592
Karma: 4214
Ce qui m'impressionne c'est qu'il existe ici des koreusiens pour répondre sérieusement dans ce topic:-o 😃

A l'instar e Zertyy, j'veux bien participer mais pour d'autres sujets :lol:

Contribution le : 25/11/2015 18:49
Signaler

Asmodeus
 0  #15
Je masterise !
Inscrit: 19/02/2014 16:35
Post(s): 2113
Karma: 1085
Citation :

@Galora a écrit:


Si, mais là on revient au point de départ, et j'ai fait toutes les synchro et tout avec mes données. En gros, je pourrais faire comme tu dis mais je n'ai plus le temps :-D


Mince ! tu as combien de temps ? tu sais souvent refaire un travail prend beaucoup moins de temps qu'il n'en fallait au début.

Contribution le : 25/11/2015 19:03
Signaler


 Haut   Précédent   Suivant






Si vous êtes l'auteur d'un élément de ce site, vous pouvez si vous le souhaitez, le modifier ou le supprimer
Merci de me contacter par mail. Déclaré à la CNIL N°1031721.