집계는 빅데이터 분석의 초석이다. 집계를 수행하려면 키나 그룹을 지정하고 하나 이상의 컬럼을 변환하는 방법을 지정하는 집계 함수를 사용해야 한다. 집계 함수는 여러 입력값이 주어지면 그룹별로 결과를 생성한다. 스파크의 집계 능력은 다양한 활용 사례와 가능성으로 비추어보아 매우 정교하다.
seilylook/Spark_Definition_Guide_Ch_7
Folders and files
| Name | Name | Last commit date | ||
|---|---|---|---|---|
| Name | Name | Last commit date | ||
|---|---|---|---|---|