Az egészségügyi alkalmazás adatainak bányászata, hogy több és kevésbé sikeres súlycsökkentő alcsoportot találjon
Katrina J Serrano
1 Nemzeti Rákkutató Intézet, Bethesda, MD, Egyesült Államok
Mandi Yu
1 Nemzeti Rákkutató Intézet, Bethesda, MD, Egyesült Államok
Kisha I Coa
2 ICF International, Rockville, MD, Egyesült Államok
Linda M Collins
3 Pennsylvaniai Állami Egyetem, Állami Főiskola, Pennsylvania, Egyesült Államok
Audie Atienza
2 ICF International, Rockville, MD, Egyesült Államok
Absztrakt
Háttér
Az okostelefon-alkalmazások letöltésének több mint fele súlyt, diétát és testmozgást tartalmaz. Sikere esetén ezek az életmód-alkalmazások messzemenő hatással lehetnek a betegségek megelőzésére és az egészségügyi költségmegtakarításra, de kevés kutató elemezte ezen alkalmazások adatait.
Célkitűzés
A tanulmány célja egy kereskedelmi egészségügyi alkalmazás (Lose It!) Adatainak elemzése volt a sikeres fogyás alcsoportok feltáró elemzésekkel történő azonosítása és az eredmények stabilitásának igazolása érdekében.
Mód
Keresztmetszeti, de azonosított adatok a Lose It! elemeztük. Ezt az adatkészletet (n = 12 427 196) véletlenszerűen felosztottuk 24 részmintára, és ebben a tanulmányban 3 részmintát használtunk (n = 972 687 együtt). Osztályozási és regressziós fa módszereket alkalmaztak a testsúlycsökkenés csoportosulásainak feltárására egy almintával, leíró elemzésekkel pedig a többi csoportjellemzőt. Az adatbányászati validálási módszereket további 2 almintával végeztük.
Eredmények
Az 1. almintában a felhasználók 14,96% -a elveszítette kezdő testtömegének legalább 5% -át. A besorolás és a regressziós fa elemzése 3 külön alcsoportot azonosított: az „alkalmi felhasználóknak” volt a legalacsonyabb az aránya (4,87%) azok közül, akik sikeresen lefogytak; Az „alapfelhasználóknak” 37,61% -os fogyás volt a siker; az „energiafelhasználók” pedig a fogyás sikerének legnagyobb százalékát 72,70% -kal érték el. A viselkedési tényezők meghatározták az alcsoportokat, bár az alkalmazással kapcsolatos viselkedési jellemzők tovább megkülönböztették őket. Az eredményeket további elemzésekben külön almintákkal ismételtük.
Következtetések
Ez a tanulmány azt mutatja, hogy a különféle alcsoportok azonosíthatók a „rendetlen” kereskedelmi alkalmazások adataiban, és az azonosított alcsoportok megismételhetők független mintákban. Viselkedési tényezők és az egyedi alkalmazásfunkciók használata jellemezte az alcsoportokat. Az információk célzása és testreszabása bizonyos alcsoportokhoz növelheti a fogyás sikerét. A jövőbeni tanulmányoknak meg kell ismételniük az adatbányászati elemzéseket a módszertani szigor növelése érdekében.
Bevezetés
Az okostelefonok tulajdona az amerikai felnőttek körében a 2011. évi 35% -ról 2015-re 68% -ra nőtt [1]. Ez a növekedés egybeesett az okostelefonos alkalmazások elterjedésével, és az összes alkalmazásletöltés 19% -a összefügg az egészséggel, és több mint a fele súlyt, diétát és testmozgást jelent [2]. Ez új lehetőségeket kínál az egészségügyi magatartás megváltoztatásához és a fogyáshoz szükséges beavatkozások megvalósításához az Egyesült Államokban, ahol az elhízás aránya továbbra is magas [3].
Bár az alkalmazások nagy ígéretet mutatnak az egyének fogyásának és az életmódbeli szokások kezelésének elősegítésére [4-6], a kereskedelmi alkalmazások egészségügyi viselkedésre és fogyásra gyakorolt hatását alátámasztó bizonyítékok még mindig hiányoznak. Ennek oka lehet a bizonyítékokon alapuló súlycsökkentési elvek hiánya a jelenleg elérhető alkalmazásokban [7]. De tekintettel ezeknek az alkalmazásoknak a népszerűségére, a lehetséges következmények messzemenőek, nemcsak a betegségek megelőzése (pl. Cukorbetegség, szív- és érrendszeri betegségek, rák), hanem a költségmegtakarítás szempontjából is [8–11].
A kereskedelmi egészségügyi alkalmazásokból összegyűjtött adatokat gyakran nem a tudományos kutatást szem előtt tartva gyűjtik. Ezek az alkalmazások azonban több millió felhasználót érhetnek el. Szigorú tudományos módszerekkel elemezve az ezekből az alkalmazásokból összegyűjtött, potenciálisan gazdag adatok fontos betekintést nyújthatnak abba, hogy a viselkedés megváltozik-e naturalista körülmények között a lakosság nagy szegmensei között. A feltáró elemzések, például az adatbányászati módszerek, amelyek felhasználhatók a meglévő egészségügyi adatok vizsgálatára, nem új keletűek [11–13], de ritkán használták őket kereskedelmi alkalmazásokból összegyűjtött egészségügyi adatok vizsgálatára.
Ezenkívül a feltáró elemzések megbízhatóságának és megbízhatóságának vizsgálatára szolgáló tudományos módszerek (azaz az adatbányászat validálási módszerei) szintén rendelkezésre állnak egy ideje [14,15], de ezeket nem használták az egészségügyi alkalmazások adataihoz. Több millió ember használja a kereskedelmi egészségügyi alkalmazásokat, így mind a feltáró adatbányászat, mind az adatbányászati validálási módszerek gyors egymásutánban történnek. Az adatbányászati validációs módszerek növelik a feltáró megközelítések tudományos szigorát azáltal, hogy tesztelik, hogy a kezdeti eredmények stabilak-e.
Tudomásunk szerint egyetlen tanulmány sem tárta fel a súlycsökkentő kereskedelmi alkalmazás hatékonyságát, és nem értékelte a feltáró eredmények megbízhatóságát. Ennek a tanulmánynak az volt a célja, hogy (1) a túlsúlyos és elhízott felnőttek súlycsökkenésének gyakoriságát értékelje egy kereskedelmi alkalmazás által összegyűjtött adatok alapján, (2) feltáró adatbányászati technikák segítségével azonosítsa a sikeres fogyás alcsoportokat és jellemzőiket, és (3) független minták segítségével vizsgálja meg az azonosított alcsoportok megbízhatóságát.
Mód
Adatkészlet
Elemeztük a keresztmetszeti, de-azonosított adatok (n = 12 427 196) egy részét, amelyeket közvetlenül a Lose It-től kaptunk! (FitNow Inc., Boston, MA, USA). Az adatokat a Nemzeti Rákkutató Intézet kutatói csak kutatási célokra bocsátották rendelkezésre. Lose It! - 2008-ban indult el - egy fogyókúrás alkalmazás, amely mind az iOS, mind az Android alkalmazáspiacon, valamint az interneten keresztül elérhető. Elveszít! (a továbbiakban: alkalmazásnak hívják) nyomkövető eszközöket biztosít a felhasználók számára (pl. vonalkódolvasók); kapcsolatok más eszközökkel és alkalmazásokkal (pl. Fitbit, RunKeeper); motiváció és támogatás (pl. kapcsolat a barátokkal); és táplálkozással kapcsolatos visszajelzések (pl. rendszer által létrehozott jelentések, amelyek összehasonlítják a felhasználó élelmiszernaplóját az Egyesült Államok Mezőgazdasági Minisztériumának MyPlate ajánlásaival).
Az alkalmazásban a felhasználó létrehoz egy számlát és egy súlycsökkentési tervet az ember magassága, súlya, testmozgási szintje, célcélja és a kívánt heti fogyás alapján. Ezután az alkalmazás ezeket az információkat felhasználja egy becsült kalóriaköltség kiszámításához, amelynek célja a fogyás céljának eléréséhez szükséges energiahiány előállítása. A súlycsökkentési terv az étrend, a testmozgás és a testsúly naplózását jelenti önbevallás vagy szinkronizált eszköz (pl. WiFi-hez csatlakoztatott testmérleg) segítségével. Az alkalmazás motivációs és támogató eszközöket kínál, lehetővé téve a felhasználók számára, hogy azonosítsák barátaikat, és megosszák velük az előrehaladást és az információkat. A felhasználók olyan csoportokban is részt vehetnek, amelyek célja a felhasználók motiválása; például egy kiemelt csoportot - „Mindannyian együtt vagyunk ebben!” - „csoportnak nevezzük, akik motivációt szeretnének adni, és akik motivációt akarnak szerezni.”
Az elemzett adatok olyan felhasználóktól származnak, akik az alkalmazást a 2008-2014-es években rendelkeztek. Az elemzéshez szolgáltatott adatok az alkalmazás metaadat-jelentési adatbázisából származnak, amelyet az alkalmazás működéséhez használnak, és amely általános összefoglalást nyújt a felhasználói tevékenységről. Így az elemzett adatok keresztmetszeti jellegűek voltak. Az adatkészlet a következő információkat tartalmazta: életkor a fiók létrehozásakor, nem, magasság, testtömeg, testtömeg-index (BMI), kívánt célsúly, kívánt heti súlycsökkenés, az étkezéshez és testmozgáshoz bejelentkezett napok száma, a testmozgás száma elégetett kalóriák, az elfogyasztott kalóriák száma, a lemért alkalmak száma, az aktív napok száma, az utolsó tevékenység dátuma, a felhasználói fiókhoz csatlakoztatott eszközök és alkalmazások, a használt operációs rendszer típusa, az alkalmazásban lévő barátok és csoportok száma, kihívások, amelyekben a felhasználók részt vettek, a testreszabott célok száma, ételek, receptek és gyakorlatok, amelyeket a felhasználók bevittek, valamint az alkalmazás-specifikus opciók (pl. van képe, emlékeztetőket használ). A testsúlyra és az egészségre vonatkozó magatartás adatait saját maguk jelentették be, míg a technikával kapcsolatos adatokat (pl. A használt operációs rendszer típusa, alkalmazás-specifikus opciók) az alkalmazás adatbázisából kapta. Időintenzívebb longitudinális adatok a felhasználók teljes mintájához 2008 és 2014 között az elemzések idején nem voltak könnyen elérhetőek.
Az érdeklődés eredménye a fogyás volt, amelyet e tanulmány céljából a felhasználó kezdő testtömegének legalább 5% -ának elvesztésével határoztak meg, amelyről kiderült, hogy jótékony hatással jár az egészségre [16-18]. Ezt úgy számították ki, hogy a felhasználó kezdő súlyának 5% -át levonták a felhasználó minimális súlyából. Ha ez a szám nullánál kisebb vagy egyenlő volt, akkor a fogyást igen, a többit nem kategóriába sorolták. A következő prediktorokat vonták be az elemzésekbe: életkor, nem, mérlegelések száma, célsúly, heti súlycsökkentési cél, kezdő súly, kezdő BMI, naplózott étkezési és testmozgási napok, átlagos étkezési és testmozgási kalóriák, aktív napok az alkalmazásban, az alkalmazás felépítésének kora, a használt eszköz vagy alkalmazás típusa, a használt operációs rendszer típusa, a barátok száma, a csoportok száma, a kihívások száma, az emlékeztetők használata, a testreszabott célok, a testreszabott receptek, a testreszabott gyakorlatok és az alkalmazás konkrét opciók.
Statisztikai analízis
Osztályozási és regressziós fa (CART) elemzést az 1. almintában (a továbbiakban, mint oktatási minta) végeztünk. A CART módszereket egyre inkább alkalmazzák az egészségügyi magatartás kutatásában feltáró célokra [19–23]. A CART elemzés a döntési fa módszertanának egy típusa, amelyet rekurzív particionálásnak is neveznek, és amely hasznos predikciós modellek összeállításához adatokból [19,20,24-26]. A CART nem paraméteres statisztikákkal azonosítja az egyének egymást kizáró és kimerítő alcsoportjait, akik közös jellemzőkkel rendelkeznek, amelyek befolyásolják a függő érdeklődő változót. A CART eljárás egy előre kiválasztott osztási kritériumot használ az összes lehetséges független változó értékeléséhez, és egy olyan változót (azaz osztó változót) választ, amely olyan bináris csoportokat eredményez, amelyek a leginkább függenek a függő változótól. Az alkalmazott felosztási kritérium a sokféleség Gini-indexe volt [25], amely kiválasztja azt a felosztást, amely maximalizálja a csomópont szennyeződésének vagy diverzitásának csökkenését, ezáltal csökkentve az osztályozás hibáját [19,25].
A CART módszereknek számos előnye van a hagyományosabb megközelítésekkel szemben, például a logisztikai regresszióval. Mivel a CART eredendően nem paraméteres, nem tételezzük fel az adatok mögöttes eloszlását. Így képes kezelni az erősen torzított eloszlásokat, vagy akár a szélsőséges pontszámokat vagy kiugrásokat is [19,20,26]. A CART kifinomult módszerekkel rendelkezik a hiányzó adatok kezelésére, és a hiányzó adatokat minden egyes változóra figyelembe veszik minden egyes osztási pontban. Ha egy adott megosztási pontból hiányoznak az adatok, akkor az elsődleges osztóhoz hasonló információkat tartalmazó helyettesítő változókat kell használni [27,28]. Ez szintén fontos szempont, tekintettel a hiányzó adatokra, amelyek általában a kereskedelmi egészségügyi alkalmazások adataiban láthatók.
A CART elemzést R-ben (3.1.3 verzió) végeztük, az rpart csomag használatával. Az rpart alapértelmezett beállításait használták, ezeket a paramétereket Breiman és munkatársai ajánlották [25]. A csomagról további részletek máshol találhatók [28]. Ezután a CART eredményei alapján hoztuk létre egymást kizáró alcsoportokat a képzési mintában. Leíró elemzéseket végeztek az SAS-ban (9.3 verzió, SAS Institute, Inc., Cary, NC, USA) a képzési mintával annak megállapítására, hogy a különféle alcsoportokhoz egyedi tényezők társulnak-e egyedülállóan. A nagy mintaméret miatt kétségesek voltunk a P értékek értelmezésében; ezért a szignifikanciát a prediktor változókkal magyarázott egyedi variancia határozta meg (R2 vagy Cramer V segítségével). Alapszabályként a prediktor változó által elszámolt variancia arányának legalább 1% -nak kellett lennie.
A képzési mintából azonosított CART modell előrejelzéseket ezután a 2. almintával (a továbbiakban: adatbányászati validációs 1. minta néven ismerték) értékelték, hogy megvizsgálják a modell robusztusságát. A vevő működési jelleggörbéje (AUC) alatti területet használtuk az osztályozási fa pontosságának értékelésére az 1. adatbányászati validációs mintával. További értékelést a 3. almintával (a továbbiakban: adatbányászati validációs 2. minta), és a Ezzel az almintával AUC-t is kaptunk. Az AUC elemzéseket R-ben (3.1.3 verzió) végeztük, a pROC csomag használatával. A csomagról további részletek máshol találhatók [29]. Az elemzésekre vonatkozó megjegyzésekkel ellátott kód itt található: https://github.com/kayserra/sample_code. Feltáró célokra CART módszereket is alkalmaztunk az adatbányászat 2. validációs mintájával. A bonyolultsági paraméter alapértelmezett beállításait (azaz egy kritériumot, amely figyelembe veszi a téves osztályozás következményeit) 0,001-re változtattuk 0,01-re, és a minimális egy csomópont a felosztás kiszámításához, valamint a terminál csomópont 3000-re (a minta 1% -a) szemben az alapértelmezett 20, illetve 7 értékkel.
Eredmények
Analitikai minta
A 3 almintára alkalmazott adattisztítási és kizárási kritériumok a következő analitikai mintákat eredményezték: n = 324 649 az 1. alminta esetében, n = 324 063 a 2. alminta esetében és n = 323 975 a 3. alminta esetében (az 1. ábrán bemutatott adatfolyam-diagram).
- Hoodia Ez az étrend-kiegészítő segíti a fogyást a Beacon egészségügyi rendszerben
- Hogyan lehet karcsú karcsú gyorsan (ÚJ) Egészségügyi kiegészítők és fogyás Természetes zsírégető ételek által jóváhagyott
- Luxus karcsúsító karkötő- fogyás kerek fekete kő mágneses terápiával Egészség Fruugo AU
- Mennyire hatékony az olajhúzás a fogyás érdekében (10 legfontosabb egészségügyi előny)
- Ladyboss fogyás esküvők, fitnesz és egészség Esküvői fórumok WeddingWire