2021. 3. 30. 22:18ใData science
1. ๋ฐ์ดํฐ ์ฐ์ ์ ๋ฐ์
(1-1) 2010๋ ์ด์ : ๋์งํธํ์ ํตํฉ์ ์๋
DBMS ๊ฐ๋ฐ, ํ์ฉ ๋ฒ์ ํ์ฅ, ๋ฐ์ดํฐ ์ฒ๋ฆฌ ๋ฐฉ๋ฒ ๋ฐ ๊ธฐ์ ๋ฐ์ , ์ ๋ฌด ํจ์จํ๋ฅผ ์ํ ํตํฉ์ ์๋๋ก ๋ฐ์ , DW๊ตฌ์ถ ๋ฐ ๊ด๋ฆฌ, BPR, CRM, ERP, SCM ๋ฑ์ ํ๋ก์ ํธ๊ฐ ๊ฐ ๊ธฐ์ ์์ ํ์ฉ ๋จ
*๋ฐ์ดํฐ์ ๊ท๋ชจ๋ EB-> ZB๋ก, ์ ํ์ ์ ํ๋ฐ์ดํฐ->๋น์ ํ๋ฐ์ดํฐ->์ฌ๋ฌผ ์ธ์ง ์ ๋ณด ๋ก, ํน์ฑ์ ๊ตฌ์กฐํ > ๋ค์์ฑ, ๋ณตํฉ์ฑ, ์์ -> ํ์ค์ฑ, ์ค์๊ฐ์ฑ์ผ๋ก ๋ณํํด๊ฐ๋ค.
(1-2) 2010๋ ์ดํ : ๋ถ์๊ณผ ์ฐ๊ฒฐ์ ์๋
โ ๋ถ์
๊ธฐ์ ๋ฐ์ ์ผ๋ก ์ธํ ๋ฐ์ดํฐ์ด ์์ & ์ง์ ํ๋ -> ๋น ๋ฐ์ดํฐ์ ๋ฑ์ฅ
๋น ๋ฐ์ดํฐ ์ฒ๋ฆฌํ ๋ถ์ฐ๋ณ๋ ฌ์ฒ๋ฆฌ๊ธฐ์ ์ ๋ฐ์ -> ๋น ๋ฐ์ดํฐ ๋ถ์์ด ๋น์ฆ๋์ค์ ํ์ฉ
+ ์ธ๊ณต์ง๋ฅ ๋ถ์ผ์ ๋จธ์ ๋ฌ๋, ๋ฅ๋ฌ๋ ๊ธฐ์ ๋ฐ์
+ DW์์ Data lake ๋ก ์งํ -> BI ๊ฐ ๊ธฐ์ ์ ๋ต ์๋ฆฝ์ ์ค์ํ ํํธ๋ก ์๋ฆฌ ๋งค๊น
โก ์ฐ๊ฒฐ
IoT ์ผ์, ๋ถ์ ์ฅ๋น, ์ฌ๋, ๊ธฐ์ ์ ์ฐ๊ฒฐ์ด ์งํ -> ๊ฑฐ๋ํ ๋คํธ์ํฌ
*๋ง์ด๋ฐ์ดํฐ : ๋ฐ์ดํฐ์ ์ ์์ ์์ธ ๊ฐ์ธ์ด ๋ฐ์ดํฐ์ ๋ํ ๊ถ๋ฆฌ๋ฅผ ์์ ํ๊ณ ํ์ฌํ ์ ์์ด์ผ ํ๋ค๋ ๊ฐ๋
*๋ฐ์ดํฐ ์ฐ์ ์ ์งํ
*4์ฐจ ์ฐ์ ํ๋ช : ํด๋ผ์ฐ์ค ์๋ฐํ์ 4์ฐจ ์ฐ์ ํ๋ช , ๋น ๋ฐ์ดํฐ ๋ถ์, ์ธ๊ณต์ง๋ฅ, ๋ก๋ด๊ณตํ, ์ฌ๋ฌผ ์ธํฐ๋ท, ๋ฌด์ธ ์ด์ก ์๋จ, 3D ํ๋ฆฐํ , ๋๋ ธ ๊ธฐ์ ๊ณผ ๊ฐ์ 7๋ ๋ถ์ผ์์์ ์๋ก์ด ๊ธฐ์ ํ์
*๋น ๋ฐ์ดํฐ์ ์ธ๊ณต์ง๋ฅ ๊ธฐ์ ์ ์ตํฉ : ๋น ๋ฐ์ดํฐ์ AI์ ์ ๊ตํ ์ฐ๊ณ๋ฅผ ํตํ ์๋ก์ด ์ฌํ์ ์๋น์ค ์์ฐ์ด ์ค์, ์์ง์ AI + ์ฐ๋ฃ๋ ๋น ๋ฐ์ดํฐ
2. ๋น ๋ฐ์ดํฐ ๋ถ์๊ณผ ์ธ์ฌ์ดํธ
(2-1) ๋น ๋ฐ์ดํฐ ๋ถ์๊ณผ ์ธ์ฌ์ดํธ
๋ฐ์ดํฐ๋ ํฌ๊ธฐ๊ฐ ์๋๋ผ, ๋ฐ์ดํฐ๋ก๋ถํฐ ์ด๋ค ์๊ฐ๊ณผ ์ธ์ฌ์ดํธ๋ฅผ ์ป์ ์ ์๋๋์ ๋ฌธ์ . ๋ถ์์ ๋ฐฉ๋ฒ๊ณผ ์ฑ๊ณผ์ ๋ํ ์ดํด๋ถ์กฑ
์ ๋ต์ ์ธ ์ธ์ฌ์ดํธ๋ฅผ ๊ฐ์ง๊ณ ํต์ฌ์ ์ธ ๋น์ฆ๋์ค์ ์ง์คํ์ฌ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ํ๊ณ ์ฐจ๋ณ์ ์ธ ์ ๋ต์ผ๋ก ๊ธฐ์ ์ด์์ด ํ์
์ฌ๋ก1) ์ธ์ด์๋ : ๋ฐ์ดํฐ ๋ถ์์ ํ์ผ๋ ์ง๊ด๋ ฅ ๋ณด์กฐํ๋ ์๋จ์ผ ๋ฟ, ๊น์ด ์๋ ๋ถ์ x
์ฌ๋ก2) ๋ฏธ๊ตญ ํญ๊ณต์ฌ : ์๋ฉ๋ฆฌ์นธ ํญ๊ณต์ ํ ๊ฒฝ์์ฌ์ ์ฐจ๋ณํ ๋ชปํด์ ์ด๊ธฐ๋น์ฉ์ ์ ๊ฐํ์์ผ๋ ๊ฒฝ์ ์ฐ์ ํ๋ฝ , ์ฌ์ฐ์ค์จ์คํธํญ๊ณต์ ๋ฐ์ดํฐ ๋ถ์ ๊ฒฐ๊ณผ ์ธ์ฌ์ดํธ๋ฅผ ๋์ถํ๊ณ ํ์ฉํ์ฌ 36๋ ์ฐ์ ํ์, ๋์ ์์ฅ๊ฐ์น ํ๋ณด
(2-2) ์ผ์ฐจ์์ ๋ถ์๊ณผ ์ ๋ต ๋์ถ์ ์ํ ๊ฐ์น ๊ธฐ๋ฐ ๋ถ์
*์ผ์ฐจ์์ ๋ถ์ (์ฐ์ ๋ณ) - ์๋์ง ์ฐ์ (ํธ๋ ์ด๋ฉ, ๊ณต๊ธ/์์ ์์ธก - ํท๊ฐ๋ฆฌ์ง ์๋๋ก ์ฃผ์ํ ๊ฒ)
*์ ๋ต ๋์ถ์ ์ํ ๊ฐ์น ๊ธฐ๋ฐ ๋ถ์
์ผ์ฐจ์์ ๋ถ์์ ์ ๊ณ ๋ด๋ถ์ ๋ฌธ์ ์๋ง ํฌ์ปค์ค๋ฅผ ๋๋ ๊ฒฝ์ฐ๊ฐ ๋๋ถ๋ถ์ด๋ค. ํ์ฉ ๋ฒ์๋ฅผ ํ์ฅํ๊ณ ์ ๋ต์ ์ผ๋ก ๋ณํ์์ผ ์ ๋ต์ ์ธ์ฌ์ดํธ๋ฅผ ์ฃผ๋ ๊ฐ์น ๊ธฐ๋ฐ ๋ถ์ ๋จ๊ณ๋ก ๋์๊ฐ ๋์ ๊ธฐ์ ์์ ์ค์ํ ๊ธฐํ๋ฅผ ๋ฐ๊ตดํ๊ณ ๊ฒฝ์์ง์ ์์ฌ๊ฒฐ์ ์ ์ํฅ๋ ฅ์๋ ๊ฒฐ๊ณผ๋ฅผ ๊ณต์ ํ ์ ์์ ๊ฒ์ด๋ค.
3. ์ ๋ต์ ์ธ์ฌ์ดํธ ๋์ถ์ ์ํ ์ญ๋
(3-1) ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค์ ์ดํด์ ์ญํ
๋ฐ์ดํฐ ์ฌ์ด์ธ์ค๋ ์ ํ ๋๋ ๋น์ ํ๋ฅผ ๋ง๋ก ํ๊ณ ๋ค์ํ ์ ํ์ ๋ฐ์ดํฐ๋ฅผ ๋์์ผ๋ก ํ์ฌ ์๋ฏธ ์๋ ์ ๋ณด๋ฅผ ์ถ์ถํด๋ด๋ ํ๋ฌธ
๋ฐ์ดํฐ ๋ง์ด๋์ ๋ถ์์ ํฌ์ปค์ค, ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค๋ ๋ถ์๋ฟ ์๋๋ผ ์ ๋ฌ ๊ณผ์ , ์ธ์ฌ์ดํธ ๋์ถ์ ์ด๋ฅด๋ ์ ์ฒด์ ์์ ์ ๋ชจ๋ ํฌ๊ดํ๋ ๊ฐ๋
๋ฐ์ดํฐ ์ฌ์ด์ธํฐ์คํธ์ ์ค์ ํต์ฌ ์ญ๋ : ์ํต
(3-2)๋ฐ์ดํฐ ์ฌ์ด์ธ์ค์ ๊ตฌ์ฑ ์์
โ ๋ถ์ํ(Analytics) : ์ํ, ํ๋ฅ ๋ชจ๋ธ, ๋จธ์ ๋ฌ๋, ๋ถ์ํ, ํจํด ์ธ์๊ณผ ํ์ต, ๋ถํ์ค์ฑ ๋ชจ๋ธ๋ง ๋ฑ
โก IT(Data Management) : ์๊ทธ๋ ํ๋ก์ธ์ฑ, ํ๋ก๊ทธ๋๋ฐ, ๋ฐ์ดํฐ ์์ง๋์ด๋ง, ๋ฐ์ดํฐ ์จ์ดํ์ฐ์ง, ๊ณ ์ฑ๋ฅ ์ปดํจํฐ ๋ฑ
โข ๋น์ฆ๋์ค ๋ถ์ : ์ปค๋ฎค๋์ผ์ด์ , ํ๋ ์ ํ ์ด์ , ์คํ ๋ฆฌํ ๋ง, ์๊ฐํ ๋ฑ
(3-3)๋ฐ์ดํฐ ์ฌ์ด์ธํฐ์คํธ์๊ฒ ์๊ตฌ๋๋ ์ญ๋
โ ํ๋์คํฌ : ๋น ๋ฐ์ดํฐ์ ๋ํ ์ด๋ก ์ ์ง์(๊ธฐ๋ฒ, ๋ฐฉ๋ฒ๋ก ๋ฑ) + ๋ถ์ ๊ธฐ์ ์ ๋ํ ์๋ จ(์ต์ ์ ๋ถ์ ์ค๊ณ ๋ฐ ๋ ธํ์ฐ)
โก ์ํํธ์คํฌ : ํต์ฐฐ๋ ฅ ์๋ ๋ถ์, ์ค๋๋ ฅ์๋ ์ ๋ฌ, ๋ค๋ถ์ผ ๊ฐ ํ๋ ฅ
(3-4)๋ฐ์ดํฐ ์ฌ์ด์ธ์ค : ์ ๋๋ถ์์ด๋ผ๋ ๊ณผํ + ์ธ๋ฌธํ์ ํต์ฐฐ์ ๊ทผ๊ฑฐํ ํฉ๋ฆฌ์ ์ถ๋ก ์ ํ์ํ๊ฒ ์กฐํฉํ ์ ์์ด์ผ ํ๋ค.
ํ๋ ์คํฌ์ ๊ณผํ , ์ํํธ ์คํฌ์ ์ธ๋ฌธํ์์ ๋์จ๋ค. ๊ทธ๋ฆฌํ์ฌ ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค๋ ๊ณผํ๊ณผ ์ธ๋ฌธํ์ ๊ต์ฐจ๋ก์ ์๋ค๋ ๋ง์ด ๋์๋ค.
4. ๋ฐ์ดํฐ ์ฌ์ด์ธ์ค์ ๋ฏธ๋
(4-1) ํ๋์ ๊ฐ์น ํจ๋ฌ๋ค์: ๋์งํธํ , ์ฐ๊ฒฐ, ์์ด์ ์
- ๋์งํธํ : ์ด์ ํ๋ก๊ทธ๋จ, ์ํํธ์จ์ด ํ๋ก๊ทธ๋จ
- ์ฐ๊ฒฐ : ๊ตฌ๊ธ ๊ฒ์ ์๊ณ ๋ฆฌ์ฆ, ๋ค์ด๋ฒ ์ปจํ ์ธ ๋ฑ
- ์์ด์ ์ : ๋ณต์กํ ์ฐ๊ฒฐ์ ํจ๊ณผ์ ์ด๊ณ ๋ฏฟ์๋ง ํ๊ฒ ๊ด๋ฆฌํ ์ ์๋ ์ญํ ์ ํ์์ฑ (๋ฐ์ดํฐ ์ฌ์ด์ธํฐ์คํธ์ ์ญ๋์ ์ข์ฐ)