網(wǎng)友評(píng)分: 5分
易明建模是一款功能十分強(qiáng)大的智能數(shù)據(jù)建模軟件,該軟件基于智能AI化建模方案,能夠完全執(zhí)行自動(dòng)化建模方案,能夠大大提高用戶的數(shù)據(jù)建模效率,提供多種智能數(shù)據(jù)建模算法,滿足用戶的多元化建模需求,提高用戶的工作效率,喜歡的小伙伴千萬不要錯(cuò)過哦。
【數(shù)據(jù)源】
1. 本地?cái)?shù)據(jù)文件
智能建模支持txt、csv等格式的數(shù)據(jù)文件。
選擇文件后,可以定義數(shù)據(jù)文件的參數(shù)配置。
下一步,可以定義變量類型、日期格式和選出狀態(tài)。
2. 數(shù)據(jù)庫
在數(shù)據(jù)源窗口中,可以定義JDBC和ODBC兩種數(shù)據(jù)源連接。
【數(shù)據(jù)探索】
1. 基本特征
導(dǎo)入數(shù)據(jù)以后,顯示了數(shù)據(jù)的基本特征:
目標(biāo)變量是Survived(需要用戶設(shè)置),有12個(gè)變量,891條記錄。
自動(dòng)解析了各個(gè)變量的類型和推薦的選出狀態(tài)。
2. 離散變量統(tǒng)計(jì)
離散變量包括單值變量、二值變量和分類變量。
缺失率:缺失值在全部數(shù)據(jù)中的占比。
勢:離散變量可取值集合的成員數(shù)量。
餅圖直觀顯示了各分類的占比。
【預(yù)處理】
1. 自動(dòng)預(yù)處理
智能建模的預(yù)處理過程集成在建模的流程中,一鍵式自動(dòng)預(yù)處理。
2. 預(yù)處理報(bào)告
建模結(jié)束后可以導(dǎo)出模型報(bào)告,描述了預(yù)處理執(zhí)行了哪些動(dòng)作。
3. 預(yù)處理流程
?。?)檢查變量值域
檢查并記錄所有變量的值域,若測試數(shù)據(jù)出現(xiàn)訓(xùn)練數(shù)據(jù)沒有的分類或者超出數(shù)值范圍,進(jìn)行針對(duì)性的處理。
?。?)時(shí)間日期變量處理
檢查所有時(shí)間日期型變量,創(chuàng)建若干常用的衍生變量。并檢測時(shí)間日期變量的關(guān)聯(lián)性,創(chuàng)建多日期聯(lián)動(dòng)的衍生變量。
?。?)缺失值信息提取
若數(shù)據(jù)存在缺失值,提取并記錄缺失值模式,將缺失值所表現(xiàn)出的行為特征轉(zhuǎn)換為衍生變量加以利用。
(4)缺失值填補(bǔ)
若數(shù)據(jù)存在缺失值,利用簡單或個(gè)性化智能算法,填補(bǔ)缺失值。
(5)分類變量降噪
針對(duì)分類變量可能存在的噪音,例如極少數(shù)分類,異常分類,疑似錯(cuò)誤分類等情況,進(jìn)行針對(duì)性處理。
?。?)分類變量數(shù)值化
將分類變量轉(zhuǎn)換為可正常進(jìn)行運(yùn)算的數(shù)值型變量。主要方式是dummy variable和平滑化,由算法智能判斷。
?。?)糾偏
針對(duì)部分存在正態(tài)性假設(shè)的模型,對(duì)高偏態(tài)變量進(jìn)行數(shù)學(xué)變換,使偏度回到0附近,滿足模型假設(shè)。
?。?)異常值處理
探測并識(shí)別可能存在的異常值,并進(jìn)行針對(duì)性處理。
?。?)變量篩選
以較寬松的門檻,剔除掉對(duì)建模無用的變量,降低時(shí)間成本和模型復(fù)雜度。
(10)標(biāo)準(zhǔn)化/歸一化
數(shù)據(jù)標(biāo)準(zhǔn)化/歸一化,消除口徑差異。有利于神經(jīng)網(wǎng)絡(luò)等模型的尋優(yōu)求解。
?。?1)平衡樣本
對(duì)于二分類數(shù)據(jù),若正負(fù)樣本比例嚴(yán)重不均衡,會(huì)按照指定的比例配平,并智能重采樣建模。
4. 手動(dòng)預(yù)處理
選擇變量
根據(jù)變量類型去除一些無關(guān)的變量。例如ID和長文本,沒有缺失值的單值變量等。
衍生變量
用變量姐妹、配偶數(shù)量"SibSp"和 變量父母、子女?dāng)?shù)量"Parch"相加得到家庭成員數(shù)量"Family"??梢钥吹郊彝コ蓡T在1-3人時(shí)幸存率較高。
預(yù)處理選項(xiàng)
在模型選項(xiàng)中可以定義是否數(shù)據(jù)預(yù)處理和是否智能填補(bǔ)。
如果數(shù)據(jù)已經(jīng)進(jìn)行過預(yù)處理,可以取消數(shù)據(jù)預(yù)處理。
智能填補(bǔ)可以更好的對(duì)缺失值進(jìn)行補(bǔ)缺,但是會(huì)消耗更多的硬件資源和時(shí)間,當(dāng)數(shù)據(jù)量很大時(shí)不建議智能填補(bǔ)。不勾選時(shí)會(huì)進(jìn)行簡單填補(bǔ)。
python版本升級(jí)到3.9
升級(jí)依賴包兼容性到最新版
修復(fù)ubuntu24.04環(huán)境下無法打開建模ide的問題
修復(fù)個(gè)別模型異常調(diào)用cuda的問題
優(yōu)化性能,修復(fù)潛在bug
標(biāo)簽: 易明建模 數(shù)據(jù)建模
關(guān)于本站|下載幫助|下載聲明|軟件發(fā)布|聯(lián)系我們
Copyright ? 2005-2024 m.daaijiaoyu.cn.All rights reserved.
浙ICP備06019006號(hào)-1 浙公網(wǎng)安備33038102330474號(hào)