Indices varietatis statistici

E Vicipaedia

Indices varietatis sunt res statisticae, singillatim numeri, mensurae quot elementa copiae inter se differant. Hi generaliter medietates supplent, ut non modo in valorem unum omnia elementa cohibeantur, sed etiam sciatur quomodo inter se differant.

Varietas datorum statisticorum multis causis exstare potest. Saepe data varia sunt, cum in multis rebus vel hominibus mentiamur et tum eorum valores varient quia rei proprietates a multis viribus naturalibus aut socialibus conformentur: id accidit investigationibus medicis, quibus si exempli gratia medicamentum aegris sumministraverimus quibusdam, erunt qui curabuntur et qui etiam postea aegrotabunt, quia omnibus hominibus sunt variae geneticae vel valetudines; alias, data variant cum una res vel homo ipsi varient ob horam diei, instrumentum mensorium, aliasve vires naturales.

Ob hanc varietatem, prater medietatem, oportet scire quot elementa copiae varient, singillatim, circumne medietatem subiecta sint, an multum dispergantur. Hi enim indices varietatis generaliter nulli sunt nulla varietate, immo quoque elemento aequali.

Saepe indices varietates in tres genera dividuntur: indices dispersionis vel amotiones mediae, indices disaequalitatis vel differentiae mediae, atque intervalla variationis.

Amotiones mediae[recensere | fontem recensere]

Sit distributio . Patet esse medietatem arithmeticam quinariam, et ab ipsa quicque elementum distare .

Quod nobis subicit posse aliquem varietatem elementorum mentiri per medietatem arithmeticam distantiarum a medietate arithmetica, quae amotio simplex media appellatur; exempli distributioni est amotio media . Rite scribitur:

At saepe non simplici utimur, sed amotione quadratica media, quae est radix quadratica medietatis arithmeticae distantiarum ad secundam potentiam dignatarum:

quam plerique appellant deviationem canonicam.

Quae formula computari potest breviori, e medietate quadratica atque arithmetica exstructa:

Proprietates amotionum mediarum[recensere | fontem recensere]

  1. Nullae sunt nulla varietate, ergo cum quicque elementum aequale sit: .
  2. Numero constante elementis addito non mutantur: .
  3. Multiplicatis numero constante elementis indices duo multiplicantur magnitudine absoluta ipsius numeri: .

Variantia et deviantia[recensere | fontem recensere]

Appellatur variantia deviatio canonica ad secundam potentiam dignata:

Atque appellatur N-upla variantia deviantia:

Adaptatio deviationis canonicae distributioni frequentiarum[recensere | fontem recensere]

Cum copiae indices dispersionis adhibeantur, cui adest distributio frequentiarum, totiens differentiae quadraticae multiplicandae sunt, quotiens adsunt elementa valore . Itaque si sunt frequentiae absolutae et relativae, sic deviatio canonica fit:

Formula brevior non mutatur, medietates tamen quadratica atque arithmetica ut distributionibus frequentiarum computantur.

Cum frequentiae in classes subdividantur, in valorum locum subdendae sunt earum medietates arithmeticae aut eis absentibus valores centrales, ut computandis medietatibus frequentiis in classes subdivisis:

ubi postremum membrum est adaptatio formulae brevioris supradictae.

Differentiae mediae[recensere | fontem recensere]

Differentiae mediae ab amotionibus mediis ob id differunt, quod non elementorum distantiae a medietate computantur, sed a quoque alio elemento. Cum sit multum usitatior deviatio canonica, his indicibus magna est gravitas rationalis.

Itaque definiri potest differentia simplex media:

quae est medietas arithmetica distantiarum cuiusque elementi a quoque alio elemento.

Quia binis elementis est distantia , supradicta definitio sic quoque rescribi potest:

Differentiae simplici mediae eaedem sunt proprietates atque amotionibus mediis supradictae.

Quae cum frequentiarum distributioni computetur, distantia adhibetur omnibus binis elementis valoribus et , tum sic mutatur definitio?:

Intervalla variationis[recensere | fontem recensere]

Campus variationis[recensere | fontem recensere]

Campus variationis modo est differentia inter maximum minimumque elementum:

Huic eaedem sunt proprietates atque amotionibus differentiisque mediis.

Differentia interquartilis[recensere | fontem recensere]

Elementorum copiae dicitur differentia interquartilis differentia inter eius primum tertiumque quartile:

Ut campi variationis, huius differentiae descriptione de varietate distributionis non multum potest cognosci; differentia interquartilis enim nulla potest esse, etiam nonnulla varietate.

Indices varietatis percentuales[recensere | fontem recensere]

Omnes indices varietatis supradicti absoluti dicuntur. Indices absoluti aliquando idonei non sunt; inter alia eis non oportet uti, cum distributiones duae (aut magis) committendae sint, quod earum magnitudines possunt inter se differre. Exempli gratia sint hae duae distributiones:

Distributionis B elementa modo sunt illa distributionis A ducentupla ac quinquagintupla: earum varietas non vere commutatur. Tum absoluti indices varietatis cum id non comprehendant, magnitudinem varietatis distributionis B inflant.

Itaque oportet definire indices varietatis percentuales, qui sunt centupli indices varietatis absoluti medietate arithmetica divisi.

Inter eos potissimus est coefficiens variationis, qui est deviatio canonica percentualis:

Concentratio[recensere | fontem recensere]

Si character transferibile (et positivum) est, potest ergo in elemento deminui vel augeri (quasi ab elemento ad aliud transferatur), eius potest computari concentratio, quae mentitur cuiquene elemento sit characteris valor similis an paucis elementis sit valor maior omnibusque aliis parvus. Ergo cum pleramque summam characteris habeant elementa maximis valoribus, maior est concentratio, quam si omnia similia essent.

Singillatim habetur aequidistributio cum omnibus elementis sit isdem valor (), et maxima concentratio cum uni elemento soli sit valor positivus ().

Index Ginianus[recensere | fontem recensere]

Usitatissimus index concentrationi mentiendae est index concentrationis Ginianus. Ante pauca dicenda sunt, quam definiatur.

Oportet mentiri quot e summa characteris elementa minoribus valoribus comprehendant. Ad hoc faciendum, definimus numerum :

Ergo hic est valorum summa elementorum minoribus valoribus. Itaque modo est summa valorum characteris omnium. Nunc appellamus i-esima pars characteris numerus , et i-esima pars elementorum numerus . Notandum est aequidistributione partes characteris easdem et partes elementorum.

Itaque sic potest definiri index Ginianus:

Quod posuimus et numeros positivos, numerator est minor denominatore; index enim hic inter 0 et 1 comprehenditur, nullusque est aequidistributione unusque maxima concentratione. Ob eam rem, index Ginianus idoenus est ad distributiones committendas.

Etiam potest definiri corrationalitas concentrationis ; limite cardinalitatis ad infinitatem corrationalitas concentrationis atque index Ginianus adaequant.

Inter eius proprietates:

  1. Index Ginianus deminuitur addito omnibus elementis numero positivo: .
  2. Constat multiplicatis omnibus elementis numero positivo: .
  3. Augetur deminuto valore elementi auctoque valore elementi aliius cui valor erat maior valore deminuendo (ergo charactere "translato" ab elemento valore minore ad aliud valore maiore): .

Demonstratio proprietatum indicis Giniani[recensere | fontem recensere]

Primum demonstremus indicem deminui addito elementis numero positivo. I-esima enim pars characteris sic fit: , ubi est additus numerus; et verum id est: , quia medietas arithmetica copiae omnium elementorum certe maior est medietate subcopiae cuius elementa sunt omnia minora quam illa quae subcopiae desunt sed copiae adsunt. Itaque:

Partes enim characteris augentur, quod diminutio concentrationis exprimit.

Similiter, ut demonstretur indicem constare elementis multiplicatis, est satis id perspicere: , ergo partes characteris non mutantur, neque index.

Ad tertiam proprietatem demonstrandam, solam novam explicemus distributionem charactere translato:

Ergo partes characteris non mutantur; partes autem deminuuntur, quod augmentum exprimit concentrationis.

Curvamen Lorenzianum[recensere | fontem recensere]

Exemplum curvaminis Lorenziani.

Curvamen Lorenzianum imago curvaminis est concentrationem depicturi. Si enim ad indicem Ginianum computandum inventae sunt elementorum partes charaterisque partes , curvamen Lorenzianum est curvamen quod puncta in plano Cartesiano coniungit. In ipso plano saepe etiam depingitur linea recta ab puncto ad punctum , appellata linea aequidistributionis, atque altera per puncta , appellata curvamen maximae concentrationis.

Aequidistributione enim curvamen Lorenzianum atque linea aequidistributionis adaequant.

Per curvamen Lorenzianum etiam potest alio modo computari index Ginianus. Si enim appellamus littera aream inter curvamen Lorenzianum ac linea aequidistributionis:

ubi aream inter lineam aequidistributionis curvamenque maximae concentrationis designat.

Demonstratio indicis Giniani computabilis per curvamen Lorenzianum[recensere | fontem recensere]

Sint puncta curvaminis Lorenziani, quorum coordinatae sint . Nunc appellemus signo aream polygoni a punctis designati, signoque aream alterius polygoni a punctis designati. Id patet:

ubi signum aream polygonorum a punctis designatorum significat, quae coniuncta aream efficiunt. Quod licet scribi:

Nunc cum haec vera sciamus:

Potest computari , et quod , denique liquet:

quod erat demonstrandum.

Concentratio distributionum frequentiarum[recensere | fontem recensere]

Si distributioni frequentiarum a nobis index Ginianus computandus est, formula non simplex fit, aliquasque adaptationes necesse est facere. Definiamus littera frequentias cumulatas atque hos numeros:

Itaque potest corrationalitas concentrationis definiri:

Eadem formula haec ad frequentias in classes subdivisas adaptari potest, cum in valorum locum subdantur classium valores centrales aut, si cognoscantur, classium medietates arithmeticae.

Heterogeneitas atque homogeneitas[recensere | fontem recensere]

Omnes indices supradicti characteribus quantitativis excogitati sunt. Multum difficilius est characterum qualitativorum in unum numerum varietatem colligere, oportet enim homogeneitas atque heterogeneitas definiri.

Distributioni frequentiarum est minima heterogeneitas maximaque homogeneitas cum cuique elemento sit isdem valor characteris; est autem maxima heterogeneitas cum cuique valori sit eadem frequentia.

Exempli gratia:

Distributio maxima homogeneitate
Valor x1 x2 x3 Omnes
Frequentia 0 0 N N
Distributio maxima heterogeneitate
Valor x1 x2 x3 Omnes
Frequentia N/3 N/3 N/3 N

Itaque duo indices heterogeneitatis possunt definiri, index heterogeneitatis Ginianus atque entropia:

ubi litterae frequentias relativas designant.

Utendi delectus indicis varietatis[recensere | fontem recensere]

Varietati mentiendae plerique deviatione canonica utuntur, quod inter alia, ipsa eiusque functiones potissimae sunt in inferentia statistica. Deviatio canonica enim aptissima est varietati elementorum eadem magnitudine mensurave.

Cum id non accidat, potius quam ea differentiis mediis utendum est. Quod autem saepe non evenit, cum programmata computatralia statistica pleraque ad inferentiam statisticam conceptentur et deviationem canonicam praeponant; idem campo variationis intervalloque interquartili accidit, quibus iam non praestet uti facilius computandis, quod nunc computatores celeriter facileque computant deviationem canonicam.

Indicibus percentualibus tamen uti oportet cum distributiones elementorum magnitudine diversa conferantur; atque indices concentrationis heterogeneitatisque saepe prosunt, primi characteribus trasferibilibus, secundique qualitativis.

Nexus interni[recensere | fontem recensere]

Bibliographia[recensere | fontem recensere]