Les fonctions suivantes sont des fonctions spéciales pré-évaluées: Col Maximum. Col Moyenne. Col Minimum. Col N Manquant. Numéro de col. Col Quantile. CV (Coefficient de variation), Col Normaliser. Col Std Dev. Col Somme. Maximum. Signifier. Le minimum. NMissing. Nombre. Std Dev. Et Somme. Remarque: Les statistiques sont également calculées avec le sommaire (Statistiques récapitulatives des magasins dans les variables globales). Bien que les arguments nommés à Summarize aient les mêmes noms que ces fonctions statistiques pré-évaluées, ils n'appellent pas les fonctions statistiques pré-évaluées. La ressemblance est purement coïncidente. Toutes les statistiques sont pré-évaluées. C'est-à-dire que JMP les calcule une fois sur les lignes ou colonnes spécifiées et utilise ensuite les résultats sous forme de constantes. Parce qu'ils sont calculés une fois et ensuite utilisés à plusieurs reprises, ils sont plus efficaces à utiliser dans les calculs que les résultats calculés par formule équivalente. Pour les données Big Class. jmp, Col Mean (Hauteur) est 62.55 et Col Std Dev (Hauteur) est 4.24. Ainsi, pour chaque ligne, la formule ci-dessus soustrait 62,55 de la valeur de hauteur de lignes et divisez par 4,24. Les fonctions dont les noms commencent par Col tout fonctionnent en colonne. Ou abaisser les valeurs dans la colonne spécifiée, et renvoyer un seul numéro. Par exemple, Col Mean (hauteur) trouve la moyenne des valeurs dans toutes les lignes de la hauteur de la colonne et la renvoie en tant que résultat scalaire. Voici quelques exemples: Avec les fonctions Col, les propriétés de colonne telles que les codes de valeur manquants assignent des valeurs de données qui produisent des calculs incorrects. Supposons que la propriété de colonne Codes de valeur manquants est affectée à la colonne x1 pour traiter 999 comme une valeur manquante. Une autre colonne comprend une formule qui calcule la moyenne. Pour utiliser la valeur 999 au lieu d'une valeur manquante pour calculer la moyenne, reportez-vous à Col Stored Value () dans la formule: Les fonctions sans Col énumérées ci-dessous travaillent à travers les valeurs des variables spécifiées et renvoient un résultat de colonne. Par exemple, Moyenne (hauteur, poids) trouve la moyenne de la hauteur et du poids de la ligne courante de la table de données. Les statistiques de roaming ne sont valides que lorsqu'elles sont utilisées dans un contexte de ligne de table de données approprié. Voici quelques possibilités: La liste déroulante Intervalles de confiance vous permet de définir le niveau de confiance pour les bandes de confiance prévues. Les boîtes de dialogue des modèles de lissage saisonnier incluent une boîte Périodes par saison pour définir le nombre de périodes dans une saison. La liste déroulante Contraintes vous permet de spécifier le type de contrainte que vous souhaitez appliquer sur les poids de lissage lors de l'ajustement. Les contraintes sont: développe la boîte de dialogue pour vous permettre de définir des contraintes sur les poids de lissage individuels. Chaque poids de lissage peut être Bounded. Fixé. Ou Unconstrained comme déterminé par le réglage du menu contextuel à côté du nom de poids. Lors de l'entrée de valeurs pour des poids fixes ou bornés, les valeurs peuvent être des nombres réels positifs ou négatifs. L'exemple illustré ici a le poids de niveau () fixé à une valeur de 0,3 et le poids de tendance () limité par 0,1 et 0,8. Dans ce cas, la valeur du poids de tendance est autorisée à se déplacer dans la plage de 0,1 à 0,8 tandis que le poids de niveau est maintenu à 0,3. Notez que vous pouvez spécifier tous les poids de lissage à l'avance en utilisant ces contraintes personnalisées. Dans ce cas, aucun des poids ne serait estimé à partir des données, bien que les prévisions et les résidus seraient toujours calculés. Lorsque vous cliquez sur Estimate. Les résultats de l'ajustement apparaissent à la place de la boîte de dialogue. L'équation de lissage, L t y t (1) L t -1. Est défini en termes d'un seul poids de lissage. Ce modèle est équivalent à un modèle ARIMA (0, 1, 1) où la moyenne mobile facile à l'aide de la fonction de somme Les scientifiques et les ingénieurs utilisent des capteurs en ligne et des dispositifs de mesure pour surveiller une gamme presque infinie d'attributs de processus. En analysant les données de séries chronologiques capturées par les historiens et les enregistreurs de données, deux questions se posent régulièrement: Comment puis-je calculer une moyenne mobile et une question connexe: Comment faire pour afficher les lignes après un écart dans mes séries chronologiques JMP peut faire les deux facilement, Mais la réponse nécessite une petite connaissance d'une fonction de formule de colonne moins fréquemment utilisée. Il est souvent pratique de calculer une moyenne mobile pour les données échantillonnées dans le temps. Ceci atténue à la fois le bruit dans le flux de données et nous permet d'avoir une valeur de mesure moyenne à un moment précis dans le temps. Par exemple, dans le tableau de données de la figure 4, j'ai un pH-mètre en ligne qui enregistre une mesure une fois par seconde, mais mon compteur de turbidité ne peut enregistrer qu'une mesure toutes les 10 secondes. Je pourrais simplement faire correspondre la mesure de turbidité de 10 secondes avec la mesure de pH correspondante, mais la lecture de la turbidité représente réellement les 10 secondes précédentes de ce que l'instrument a vu, et je voudrais la comparer à une résolution similaire de 10 secondes de pH. Pour ce faire, je vais devoir calculer la moyenne mobile des 10 dernières secondes des mesures de pH. La résolution de 1 seconde et les moyennes mobiles de 10 secondes sont comparées dans le graphique de Graph Builder sous le tableau de la figure 5. La deuxième question survient lorsque l'on utilise des moyennes mobiles. Une hypothèse que nous avons avec une moyenne mobile est que chaque mesure est également espacée. Cela fait que la moyenne mobile est uniformément pondérée sur tous les intervalles. Mais périodiquement (dans la vie réelle), il y a de brèves lacunes dans le flux de données, et il faut identifier des écarts plus longs qu'un certain temps pour nous alerter que l'hypothèse est en panne. Ces lacunes sont causées par une variété de problèmes, tels que des courts-circuits, des interruptions intermittentes ou simplement des données manquantes provenant des périphériques connectés au réseau. Une moyenne mobile peut être calculée en une seule étape à l'aide de la fonction Summation dans l'éditeur de formule de colonne. La fonction de sommation (Figure 1) fonctionne comme une boucle itérative. Dans ce cas, alors que i est compris entre 0 et 9, il calcule la somme des valeurs obtenues à partir de l'argument à droite. L'argument de droite est évalué comme Lag (: pH, 0), Lag (: pH, 1), Lag (: pH, 2), Lag (: pH, 3) Lag (: pH, 9). Dans ce cas, Lag (: pH, 0) est la valeur à la rangée actuelle de la colonne pH, et Lag (: pH, 9) est la valeur 9 lignes au-dessus de la ligne courante (pour un total de 10 rangées). Le deuxième problème est un peu délicat, et il sera plus facile de le décomposer en deux étapes. Dans la première étape, nous allons faire une colonne de formule pour signaler les grands écarts de temps, puis à la deuxième étape, nous ajouterons une deuxième formule qui signalera une plage de lignes après l'intervalle de temps. La première étape consiste à créer une nouvelle colonne nommée Time Gap, puis à ajouter une formule pour signaler les écarts lorsqu'ils sont plus longs que 5 secondes comme suit: Time Stamp - Lag (: Time Stamp, 1) gt 5 Ou si vous voulez l'étape Vous pouvez utiliser la fonction Différence de date comme ceci: Différence de date (Lag (: Horodatage, 1), Time Stamp, seconde) gt 5 Dans ce cas précis, je voulais savoir quand des intervalles de temps de 5 secondes ou plus s'est produit Dans d'autres projets, je n'avais vraiment besoin que de savoir quand des écarts plus longs se produisaient. La fonction Différence de date calcule la différence entre deux valeurs de date et renvoie le résultat en unités qui peuvent être spécifiées (par exemple heure, minute, jour, semaine, année). Dans les deux cas, si la différence est supérieure à 30, la formule est évaluée comme 1 pour true et 0 pour false. Dans la deuxième étape, nous créons un nouveau nom de colonne Gap Flag et ajoutez une formule pour marquer 10 lignes suivant l'écart détecté dans la colonne d'intervalle de temps. Comme la formule de la figure 2 est la somme (i 0, 9, Lag (: Time Gap, i)) gt 0 Encore une fois, la fonction Summation (Figure 2) fonctionne comme une boucle itérative. Cette fois, il est combiné avec un argument conditionnel. Alors que i est compris entre 0 et 9, si la somme des valeurs dans la colonne Time Gap est supérieure à 0, la formule est évaluée comme 1 pour true ou 0 pour false. S'il y a au moins un 1 dans la colonne Temps d'intervalle pour les 30 lignes précédentes, la valeur de cette colonne d'indicateur est égale à 1. Avec juste quelques petits ajustements, nous pouvons avoir cette formule fixée la couleur du fabricant de ligne, aussi. Pour utiliser cette formule, créez une nouvelle colonne et définissez le type de données en état de ligne. Etat de la couleur (rouge), état de la ligne () Etat de la couleur (bleu) La fonction de somme est un outil important dans votre JMP Pour plus d'informations sur la syntaxe et l'utilisation de la fonction Summation, consultez Utilisation de JMP, les guides Scripting Guide et l'index Scripting - tous se trouvent sous le menu Aide dans JMP.
No comments:
Post a Comment