ArcGIS пен жасанды интеллектті пайдаланып геофизикалық деректерді талдауды үйрететін интерактивті платформа.
Зертханалық жұмыстар
2.1
Кітапхана орнату және тексеру
pip install, import, нұсқаларды тексеру
Pythonpip
›
2.2
Информатика + Математика
NumPy, статистика, матрицалар
NumPyМатематика
›
2.3
Информатика + География
Геодеректер, координаттар, картография
PandasGeo
›
2.4
ArcGIS ML тапсырмалары
IsolationForest, аномалия, CSV экспорт
ArcGISML
›
Модуль 01 · 1.1–1.2
Python және Scikit-learn
🧠 Python дегеніміз не?
Python — ғылым, деректер талдау және жасанды интеллект саласында ең көп қолданылатын бағдарламалау тілі. Оның синтаксисі қарапайым және оқуға оңай. Геофизикада Python деректерді өңдеу, модельдеу және визуализация үшін пайдаланылады.
Біз үш негізгі кітапхана қолданамыз:
NumPy — сандық есептеулер, матрицалар, массивтер
Pandas — кесте түріндегі деректермен жұмыс (DataFrame)
Scikit-learn — машиналық оқыту алгоритмдері
📊 DataFrame дегеніміз не?
DataFrame — Pandas кітапханасындағы кесте. Дәл Excel-дегі кесте сияқты: бағандар мен жолдар бар. Геофизикалық деректерді осы форматта сақтаймыз.
Мысалы: бұрғылау ұңғымасынан алынған тереңдік пен гравитация мәндерін DataFrame-ге жазамыз, содан кейін статистика шығарамыз.
💻 Код талдауы
module_1.pyPython
importnumpyasnpimportpandasaspdfromsklearn.preprocessingimportStandardScaler# Геофизикалық деректер — тереңдік пен гравитацияdata = {'тереңдік': [100,250,400,600,900],
'гравитация': [980.1,979.8,979.5,979.2,978.9]}
df = pd.DataFrame(data)
print(df.describe())
import numpy as np
NumPy кітапханасын жүктейміз. np — қысқа атауы (alias)
import pandas as pd
Pandas кітапханасын жүктейміз. Деректер кестесімен жұмыс үшін
StandardScaler
Деректерді нормализациялау класы — барлық мәндерді бір ауқымға келтіреді
data = {'тереңдік': [...]}
Python сөздігі (dictionary) — кілт:мән жұбы. Бағандардың аттары мен мәндері
pd.DataFrame(data)
Сөздіктен кесте жасаймыз. Енді df — толыққанды деректер кестесі
df.describe()
Статистиканы автоматты шығарады: min, max, mean, std және т.б.
data сөздігіне жаңа баған қос: 'магниттік_өріс' — 5 кез-келген сан жаз
Кодты іске қос және нәтижені мұғалімге жібер
Қосымша:df.shape және df.columns командаларын қосып, не шығатынын тексер
💡 Кеңес: df.shape — кестенің өлшемін (жолдар, бағандар) көрсетеді. df.columns — баған атауларын береді.
Модуль 02 · 1.3
Random Forest алгоритмі
🌳 Random Forest дегеніміз не?
Random Forest (Кездейсоқ орман) — машиналық оқытудың ең танымал алгоритмдерінің бірі. Ол бірнеше шешім ағашынан тұрады. Әр ағаш деректердің бір бөлігін зерттеп, өз болжамын береді. Соңында барлық ағаштардың болжамы біріктіріліп, дұрыс жауап анықталады.
Геофизикада: сейсмикалық қауіп деңгейін болжау, тау жыныстарын классификациялау, мұнай іздестіру.
⚙️ Негізгі параметрлер
n_estimators — ормандағы ағаштар саны. Көп болса — дәлдік жоғары
max_depth — ағаштың максималды тереңдігі. Шектемесе — overfitting болады
random_state=42 — кездейсоқтықты бекітеді, нәтиже әрдайым бірдей
feature_importances_ — қандай белгі маңызды екенін көрсетеді
📐 train_test_split дегеніміз не?
Деректерді екіге бөлеміз: үйрету жиыны (train) және тексеру жиыны (test). 75% үйретуге, 25% тексеруге. Тексеру жиынын модель бұрын көрмеген — нақты дәлдікті өлшейміз.
n_estimators мәнін 10-ға өзгерт — дәлдік қалай өзгерді?
n_estimators мәнін 200-ге өзгерт — дәлдік қалай өзгерді?
Қай белгі ең маңызды? Неге солай деп ойлайсың?
Нәтижені мұғалімге жібер
💡 Кеңес: Геофизикада биіктік (рельеф) сейсмикалық белсенділікпен тығыз байланысты — тау аймақтарында жер сілкіну жиі болады. Сондықтан биіктік белгісі маңыздырақ.
Модуль 03 · 1.4–1.5
ArcGIS Python API
🌍 ArcGIS дегеніміз не?
ArcGIS — Esri компаниясының географиялық ақпараттық жүйесі (ГАЖ). Бүкіл әлемде геологтар, геофизиктер, экологтар және урбанистер қолданады. ArcGIS арқылы картаны жасап, геофизикалық деректерді визуализациялап, кеңістіктік талдау жүргізуге болады.
ArcGIS Python API — ArcGIS-ті Python арқылы басқаруға мүмкіндік береді. Картаны кодпен жасайсың, деректерді жүктейсің, талдайсың.
🔑 Негізгі объектілер
GIS() — ArcGIS Online-ға қосылу. Авторизациясыз қосылсаң — анонимді режим
gis.map() — интерактивті карта жасайды. Орынды және масштабты көрсетуге болады
FeatureLayer — картадағы деректер қабаты (layer). Нүктелер, сызықтар, полигондар
SpatialDataFrame — геодеректермен жұмыс жасайтын DataFrame
🗺️ Геофизикада ArcGIS қолданылуы
Сейсмикалық станциялардың орналасуын картаға түсіру
Гравитациялық аномалиялар картасын жасау
Тектоникалық жарылымдарды (fault lines) визуализациялау
Мұнай-газ кен орындарын анықтау және картаға белгілеу
stations DataFrame-ге 3 жаңа қала қос (Өскемен, Ақтау, Атырау)
Жаңа баған қос: 'сейсмикалық_қауіп' — 1-ден 4-ке дейін баға бер
Кодты іске қос, карта ашылды ма — тексер
Нәтижені мұғалімге жібер
💡 Кеңес: Алматының сейсмикалық қауіпі ең жоғары (4), себебі ол Іле Алатауы тауларының жанында орналасқан. Астана жазықта болғандықтан қауіп төмен (1).
Зертханалық жұмыс 2.1
Кітапханаларды орнату және тексеру
📦 Python кітапханалары дегеніміз не?
Кітапхана (library) — басқа бағдарламашылар жазған дайын код жинағы. Оны импорттап, функцияларын пайдалана аласың. pip — Python-ның пакет менеджері, кітапханаларды интернеттен жүктейді.
numpy — сандық есептеулер, матрицалар, массивтер
pandas — деректер кестесімен жұмыс (DataFrame)
scikit-learn (sklearn) — машиналық оқыту алгоритмдері
arcgis — ArcGIS Python API, картамен жұмыс
🔍 Нұсқаны тексеру неге маңызды?
Бағдарламаны басқа компьютерде іске қосқанда нұсқалар сәйкес келмеуі мүмкін — бұл қателерге әкеледі. __version__ арқылы қандай нұсқа орнатылғанын тексереміз. Командалық жолда pip install кітапхана_аты деп жазып орнатамыз.
np.linalg.eig(A) — A матрицасының меншікті мәндерін шығар
Нәтижені мұғалімге жібер
💡 Кеңес: B матрицасының детерминанты 0, себебі 3-ші жол 1-ші және 2-ші жолдың линейлік комбинациясы. Мұндай матрица сингулярлы деп аталады.
Зертханалық жұмыс 2.3
Информатика + География · Геодеректер
🌐 Географиялық координаттар
Жер бетіндегі кез-келген нүктенің орны екі санмен анықталады: ендік (latitude) және бойлық (longitude). Ендік — экватордан солтүстік/оңтүстікке қарай бұрыш (-90°...+90°). Бойлық — Гринвич меридианынан шығысқа (-180°...+180°).
Геофизикалық зерттеулерде координаттар өте маңызды — сейсмикалық станция, ұңғыма, өлшеу нүктесінің орнын дәл белгілеуге керек.
📏 Хаверсин формуласы
Екі географиялық нүктенің арасындағы қашықтықты есептеу үшін жай Пифагор теоремасы жұмыс жасамайды — Жер шар тәрізді. Хаверсин формуласы жер бетінің қисықтығын ескереді және дәл нәтиже береді.
cities['биіктік_м'].max() — ең биік бекетті анықта
Нәтижені мұғалімге жібер
💡 Кеңес: Алматыдан Өскеменге дейінгі қашықтық шамамен 900 км. haversine(43.24, 76.89, 49.97, 82.61) деп жаз.
Зертханалық жұмыс 2.4
ArcGIS + ML · Аномалияларды анықтау
🔍 Аномалия дегеніміз не?
Аномалия (Anomaly) — жалпы үлгіден айтарлықтай ерекшеленетін мән. Геофизикада аномалия маңызды ақпаратты береді: жер астындағы тығыздық өзгерісі, тектоникалық белсенділік, мұнай-газ қоры немесе кен орны.
Мысалы: гравитациялық аномалия — жер астында ауыр тау жынысының немесе металл кен орнының белгісі болуы мүмкін.
🌳 Isolation Forest алгоритмі
Isolation Forest — аномалияларды анықтауға арналған алгоритм. Негізгі идея: аномальды нүктелерді қалыпты нүктелерден оқшаулау оңайырақ. Алгоритм кездейсоқ ағаштар жасап, қай нүктелер тезірек оқшауланатынын анықтайды.
contamination=0.05 — деректердің 5% аномалия деп есептейміз
fit_predict() — үйретеді және болжайды: +1 (қалыпты), -1 (аномалия)
contamination мәнін 0.1-ге өзгерт — аномалиялар саны қалай өзгерді?
DataFrame-ге жаңа баған қос: 'магниттік_өріс' — np.random.normal(50000, 1000, n)
IsolationForest-ке екі белгі бер: df[['гравитация', 'магниттік_өріс']]
Нәтижені мұғалімге жібер — карта ашылды ма?
💡 Кеңес: Нақты геофизикада гравитациялық және магниттік аномалияларды бірге қарастырады — бұл кен орнын анықтаудың дәлдігін арттырады. Мысалы темір кені — магниттік аномалия да, гравитациялық аномалия да береді.