What Is Geostatistics? [Romanian]

Original publication

geostatistica, statistici spaţiale, Donald E. Myers

CE ESTE GEOSTATISTICĂ?

Acest site este întreţinut de Donald E. Myers


Tu nu trebuie să fii un statistician pentru a găsi o bună utilizare a geostatisticii, dar tu poți avea nevoie de asistenţă, support și îndrumarea unui (geo?)statistician. Un inginer, ecolog, hidrolog, fizician sau biolog bun, au deja un bun început, deoarece geostatistica este unică ştiinţă bună ce a crescut cu culugerea datelor prin recunoaşterea faptului că fenomenele naturale depind de variaţia spaţială. Studiul tău de geostatistică nu va înlocui alte cunoştinţe pe care le avei, ci mai degrabă, va extinde cunoştinţele tale şi le va face mult mai utile.

(Parafrazat dintr-o citație lui William Edwards Deming)


Un pic de istorie

Aplicarea statisticilor la problemele geologiei şi mineriei, precum şi hidrologie sau produs deja un timp considerabil. Pentru puțin, geostatisticile însemnau statistici aplicate la geologie sau poate mai mult în general, la probleme în ştiinţele pământului. Începînd cu mijlocul anilor 60 şi în special la mijlocul anilor 70 ea a devenit mai mult strâns legată cu lucrarea lui Georges Matheron şi, probabil, această legătură este încă în vigoare și astăzi. Deoarece o mare parte a lucrării sale timpurii şi, de asemenea, de aceea că primii săi studenți au apărut în Franța, aceasta lucrare nu a fost la fel de cunoscută în SUA şi în alte ţări. Oricum, mai multe lucruri au început să se schimbe. În 1975 a avut loc lângă Roma întîlnirea NATO ASI, la simposiumul Geostatisticii avansate în industria minieră. Întîlnirea conţinea documente care au fost de prima data în limba engleză. Acest lucru a fost precedat de un set de note (de Matheron), pregătit pentru un program de vară în Fontainebleau. Aceste note au fost editate în limba engleză, dar nu disponibile uşor. Un articol mai definitiv theoretic a apărut în J. Applied Probability în 1973.

Matheron a fost profesorul de la Ecole Normale Superieure des Mines din Paris (Şcoala de mine), una dintre Ecoles Grande. Ca parte a mişcării generale de unităţi de cercetare de la locul principal în Paris (lîngă Jardin du Luxembourg), Matheron a fondat Centrul de Morfologia Mathematică. Mai târziu, acesta s-a împărțit în două programe, una legată cu morfologia matematică şi altam cu geostatistici. Matheron a ieșit la pensie ca directorul Centrului numai anul trecut. Seria din două volume lui Jean Serra despre morfologie matematică şi analiza imaginii este binecunoscută şi este bazată pe cartea anterioară lui Matheron despre teoria seturilor aleatorii. Doi dintre studenții lui au avut un rol important în implantarea geostatisticii în America de Nord. Andre Journel sa mutat la Universitatea din Stanford în 1978 şi de asemenea, a fost coautorul cu Ch. Huijbrechts a lucrării Mining Geostatistics. Michel David mai devreme s-a mutat la Școală Politechnică din Montreal şi a publicat în 1977 lucrarea Geostatistical Ore Reserve Estimation. Journel a lucrat în Departamentul de Ştiinţe Aplicate a Pămîntului, dar, nu demult, acest departament a fost închis şi el este acum în Departamentul de Ingineria a Petrolului (cu ajutorul diferitor companii petroliere), şi a fondat Centrul din Stanford de Prognoze a Reservoir-ului.

Lucrarea lui Matheron nu a fost foarte bine acceptată în socieatea statisticienilor pentru o perioadă de timp, deşi un număr de statisticieni proeminenți au fost vizitatori la Fountainebleau în anii '80, '70 şi '90. Dintr-o parte, cauza a fost într-un sentiment că o parte din lucrare a fost o duplicare a rezultatelor care au fost deja binecunoscute, dar cu denumiri diferite. Înclinaţia lui Matheron de a publica numai în limba franceză şi numai în "note interne" la Centru probabil au contribuit la această percepţie. Acum însă, geostatistica a stabilit un loc pentru ea însăşi, atât în ​​interiorul revistelor de statistică cît şi la nivel naţional. La mijlocul anilor '80, cu ajutorul lui M. Armstrong, un indice al acestor note a fost publicat în Mathematical Geology, în timp ce era posibil pentru a comanda copii de la Centrul, unde nu a existat nici în afara, în general, depozit accesibil. Indicele menţionate mai sus sunt acum binecunoscute în afară de data. Din nou, cu ajutorul lui M. Armstrong, un număr mic de aceste note au aparut ca articole de revistă. GLOSAR

Software

La sfârşitul anilor anii '70 Centrul de Geostatistici din Fountainebleau, a început un program de masterat în geostatistici (doi ani), care a atras un flux constant de studenţi din industrie şi guvernare din diferite ţări. În cooperare cu Shell Oil şi cu Bureau de Recherche Geologie Mathematique (USGS în franceză), a fost creat un pachet software comercial numit BLUEPACK. Versiune timpurie a fost doar portat la VAX, dar succesorul, ISATIS, este disponibil pe un număr de platforme mai mare. Acesta este comercializat în SUA de către GEOMATH din Houston. Geostatistica fără computer reprezintă interes scăzut, și în multe sunsuri evoluţiile din geostatistică au mers paralel cu cele din calcul, în special cu apariția PC-urilor şi staţiilor de lucru.

Publicaţii şi Conferinţe

Două volume mici axate pe geostatistici a industriei miniere au apărut în limba engleză în anii 70, unul scris de către Jean-Michel Rendu şi unul de către Isabel Clark. La sfârşitul anilor '80 a apărut volumul scris de Isaaks şi Srivastava, și ulterior, o carte de Noel Cressie (mai general pe tema a statisticilor spaţiale, dar inclusiv și geostatistici).

În vara anului 1983 a doua întîlnire NATO ASI a avut loc la Lake Tahoe, Nevada, cu un amestec mai internaţional se cercetători și inclusiv dintr-un set mai larg de aplicații. Datorită seriei din patru lucrări de Richard Webster şi unii dintre studenţii lui (apoi la Centrul de Investigații din Rothamstead, Anglia), geostatistica a devenit cunoscută în ştiinţele solului. Acesta a apărut în revista J. Soil Science (1980-1981). În 1979 în Praga, Asociaţia Internaţională de Matematică Geologii a fost fondată şi mai târziu a început publicarea revista J. of the Int. Assn. Math. Geologists (mai tarziu numele acesteia a fost oficial schimbat la mai simplul – Mathematical Geology). De aceea că revista nu a fost limitată de geostatistică, ea a devenit rapid un loc principal pentru publicarea astfel de lucrari. Un al treilea congres internaţional de geostatistică a avut loc la Avignon, Franţa în 1988, al treilea la Troia, Portugalia în 1992 şi cele mai recent la Wollongong, Australia, în 1996. În urma conferinţei din 1983, Andre Journel şi Leon Borgman (Universitatea din Wyoming) au propus o întîlnire de vară anuală în geostatisticienilor ce v-a ajută cercetătorii din America de Nord. Prima dintre ele a avut loc lîngă DuBois, Wyoming în august 1984. Grupuri au fost mai mici şi familii au fost încurajați, sesiunii au fost neformale şi nici nu au fost produse diferite proceduri, dar ulterior a fost fondat un buletin de ştiri care de atunci a apărut rar. O altă non-organizație fost fondată în 1987, la o întâlnire în sud-estul munților Chirachaua din Tucson. Aici nu au fost nici impozite, nici o lista de membri, nu exista un preţ de subscriere pentru scrisori dar voluntarii au fost solicitat în fiecare să organizeze astfel de întîlniri. Mai multe întîlniri au avut loc în Canada, precum SUA şi în 1996 o reuniune a avut loc în Guanajuato, Mexic. După stabilirea buletinulului informațional în America de Nord a fost inițiat un alt buletin informativ destinat pentru Comunitatea Europeană.

În urma mai multor întîlniri a membrilor EPA în 1983 Las Vegas a devenit interesat în aplicarea geostatisticii la monitorizarerea și evaluarea a mediului . Pentru ca a sprijini cercetările pentru un număr de indivizi şi a programele, EPA a produs un pachet software a geostatisticilor, GEO-EAS, care a fost apoi produs și pentru domeniul public. GEO-EAS a fost un program pwntru DOS, dar a inclus un sistem de meniuri care l-a făcut-o destul de intuitivă, iar pretul era pus drept. Din păcate, din diferite motive, EPA nu a continuat să susţină software-ul şi acesta nu a fost actualizat de ani. In 1992 Andre Journel şi Clayton Deutsch au publicat GSLIB care a inclus o dischetă. Acest sofware a fost un set extins de programe geostatistice (cu codul de sursă FORTRAN) şi un manual pentru utilizatori. Versiunile curente ale codului sunt disponibile pe site-ul Universității din Stanford. Din păcate, programele nu include orice formă de GUI şi sunt destinate pentru a fi pornite în modul separat. Cu toate acestea ele sunt compilable pe o varietate de platforme. În 1996 Yvan Pannatier a publicat programul VARIOWIN împreună cu o dischetă. VARIOWIN este o versiune MS-Windows a două dintre componentele GEO-EAS. Acesta permite seturi de date mult mai mari decât în ​​GEO-EAS şi, de asemenea, modelarea interactive a variogramei.

Geostatistics la Universitatea din Arizona

Geostatistica a fost predat la Universitatea din Arizona de la toamna anului 1982, însă activitatea de colaborare a început mult mai devreme între Y.C. Kim și Donald Myers, A. W. Warrick (Ştiinţe despre sol, apă şi mediu) şi Donald Myers. Cursurile au atras rapid elevi din mai multe departamente: industria minieră, hidrologie, știinţele solului, apei şi mediului. Mai recent, au fost atrași studenții de la teledetecţie, patologie a plantelor, geografie, laboratorul trei cercuri, a resurselor naturale regenerabile. Aceasta este o consecinţă directă a naturii cantitative de cercetare în aceste programe diverse.

Alte direcții de dezvoltare

Au existat trei alte direcții de dezvoltare despre care ar trebui de spus. B. Matern, care lucrează în Suedia, în esenţă, a dezvoltat o teorie paralelă cu acea lui Matheron, dar cu aplicaţii, în special pentru sectorul forestier. Lucrarea lui a apărut în limba suedeză în 1960 şi nu a fost tradusă în limba engleză până în 1986 (Springer-Verlag). Y. Ghandin care lucrează în fosta Uniune Sovietică aplicat lucrarea sa în primul rînd în meterologia şi ştiinţe atmosferice unde a fost cunoscută sub numele de Analize Obiective. Această lucrare nu a apărut în limba engleză pînă în târziu, când el a emigrat în Isreal. În cele din urmă, în 1971, R. Hardy (Universitatea de Stat din Iowa) se ocupă cu probleme legate de interpolare datelor de gravitate, și el dezvoltat ceea ce a devenit cunoscut ca funcţia de bază radială. Lucrarea sa este mult mai bine cunoscută în literatura de analiză numerică.

Aplicaţii

Geostatistica e o disciplină aplicată (sau poate că nu este chiar o disciplină), și dezvoltarea ei consta în lucrul inginerilor minieri, ingineri lo de petrol, hidrologi, cercetătorilor a solului, geologilor precum şi statisticienilor. Există aplicaţii în epidemiologie, patologie plantelor sau entomologie precum şi silvicultură, stiinte atmosferice, schimbări globale, geografie. Există unele suprapuneri cu SIG (sisteme de informaţii geografice) şi în general statistici spaţiale. Ar trebui de marcat încă două alte reviste Water Resources Research și J. Soil Science Society of America. Mai recent articole au inceput sa apară în Environmetrics, Remote Sensing of the Environment precum şi mulţi alţii prea numeroase reviste, pentru a le putea menţiona.

După cum sa menţionat mai sus, hidrologia a primit aplicația din primele disciplini, și activitatea în trei locaţii ar trebui să fie marcată deosebit. Grupul lui L. Gelhar la MIT (care are legături cu New Mexico Tech în Socorro), grupul de Hidrologie de la Fontainebleau (în special G. DeMarsily care este acum la Universitatea Paris-Jussieu) şi, desigur, Departamentul de Hidrologie de la Universitatea din Arizona.

Problemele şi obiectivele

Dintr-un punct de vedere, geostatistica ar putea fi privită ca pur și simplu o metodologie de interpolare de date pe un model neregulat, dar acest lucru este prea simplu. O serie de interpolare a metodelor / algoritmilor au fost deja bine cunoscută cînd geostatistica a început să fie tot cunoscută. Inversarea distanţă de ponderare şi Tendințele suprafeţei analizate, precum si mult mai simplu cel mai apropiat algoritm vecin.

Întîi de toate, geostatistica este preocupat cu date spaţiale. Asta se întîmplă cînd fiecare valoarea a datelor este asociată cu o locaţie în spaţiu şi există cel puţin o legătură implicită între locul şi valoarea a datelor. "Locaţie" are cel puţin două sensuri, unul este pur şi simplu un punct în spaţiu (care există numai într-un sens matematic abstract) şi în al doilea rând, o suprafaţă sau volum în spaţiu. De exemplu, o valoare de date asociate cu o zonă ar putea fi valoarea medie a unei variabile observate, calculate în mediu pe acest volum. În ultimul caz ​​zona sau volumul sunt adesea numite "suportul" de date. Acest lucru este strîns legate de ideea susţinerii a unei măsuri. Fie punctele x, y, ….w (nu doar coordonatele) în dimensionalele de spaţiu 1, 2, sau 3 şi Z (x), Z (y ),…. denotați valorile observate la aceste locatii. De exemplu, aceasta ar putea fi gradul de cupru, temperatura, conductivitatea hidraulică, concentraţia poluantului. Acum, să presupunem că t este o locaţie care nu este "șablonată". Obiectivul apoi este de a estima / prezice valoarea lui Z (t) (şi locaţiile datelor, precum şi locaţia t). Numai în cazul în care această informaţie este data, atunci problema este pusă necorect, adică, nu are o soluţie unică. O modalitate de a obţine o soluţie unică este de a introduce un model în această problemă. Există două moduri de a face acest lucru – unul este determinist, iar al doilea este stochastic sau statistic. Ambele abordări trebuie să se încorporeze cumva în ideea că există o incertitudine asociată cu estimarea / pas de predicţie. Valoarea la locul neșablonat nu este însuşi aleatoare, dar cunoştinţele noastre despre ea sunt incerte. O abordare atunci este de a trata Z (x), Z (y ),…. şi Z (t) ca fiind valorile de variabile aleatoare. DACĂ distribuţia în comun a acestor variabile aleatorii este cunoscută, atunci "cel mai bun" estimator (cel mai bun sens obiectiv şi având variaţie minimă de eroarea a estimării), ar fi expectantului condiţionat lui Z (t), având în vedere valorile de alte variabile aleatorii. Cu toate acestea, datele constau doar în observaţii dintre variabilele aleatorii Z (x), Z (y ),…. şi nici pentru una dintre variabile aleatorii Z (t), și prin urmare, nu este posibil de estimat sau de a modela această distribuţie, utilizând metode standarte de modelare sau distribuţiile de probabilitate.