<br>
# <strong>정보 시각화 데이터 흐름
<strong>chapter 2
1. 다양한 외부데이터 로딩
1. D3 스케일 이용하기
1. 분석/ 출력데이터의 포맸
1. 데이터 속성에 기초한 시각적 그래프의 구현
1. 그래프의 모습을 움직이고 변화주기

<br>
## <strong>1 데이터 다루기
loading -> format -> 측정 -> 생성 -> 갱신

### <strong>01 Data Loading
CSV, JSON 포맷 데이터에서 자료 갖고오기
1. d3.csv(), d3.json() : <strong>JSON 배열</strong> 객체를 생성
1. d3.xml() : <strong>XML 문서</strong>를 생성한다

### <strong>02 file formats Data Loading
d3.csv(".csv", function(error, data) {console.log(error, data)});

### <strong>03 데이터 포맷팅
loading ==> format ==> 측정 ==> 생성 ==> 갱신
1. 정량적 데이터
1. 범주 데이터
1. 위상 데이터
1. 기하학적 데이터
1. 날짜/시간 데이터
1. 원시 데이터

### <strong>04 데이터 변환
데이터를 처리시 표현 좋은 형태로 변환
1. <strong>캐스팅</strong> : 데이터 형변환 (날짜, 정수, 실수, 배열 등의 포맷을 변환)
1. <strong>정규화</strong> : 스케일과 규모 변경
1. <strong>비닝</strong> : 데이터 분류
1. <strong>내포</strong> : 다양한 계층구조를 표현  d3.nest()

<img src="https://image.slidesharecdn.com/utahjsd3-130708153751-phpapp01/95/utahjs-d3-24-638.jpg?cb=1373297965" align='left' width='400'>

In [1]:
%load_ext py_d3

In [2]:
%%d3
<g_1> <p></p> </g_1>
<script>
    d3.csv("./data/cities.csv",
           function(error,data) { dataViz(data) });
           function dataViz(incomingData) {
                d3.select("g_1").selectAll("p.cities")
                  .data(incomingData)
                  .enter()
                  .append("div")
                  .attr("class","cities")
                  .html(function(d,i) {return d.label})}
</script>

In [3]:
%%d3       
// 숫자값에 range 선형대응을 적용
<p id='scal_1'></p>
<p id='scal_2'></p>
<p id='scal_3'></p>
<script>   // d3.scale.linear() : bin 500으로 나눈, 데이터 스케일을 선형대응 결과값을 출력
var newRamp = d3.scale.linear().domain([500000,13000000]).range([0,500]);
document.getElementById("scal_1").innerHTML = newRamp(1000000);    // 1000000 에 대응 bin을 출력
document.getElementById("scal_2").innerHTML = newRamp(9000000);    // 9000000 에 대응 bin을 출력
document.getElementById("scal_3").innerHTML = newRamp.invert(313); // .invert() 역변환 bin을 출력
</script>

In [4]:
%%d3       
// 색상 그레디언트에 range 선형대응을 적용
<p id='s_col_1'></p>
<p id='s_col_2'></p>
<p id='s_col_3'></p>
<script>   // d3.scale.linear() : bin 500으로 나눈, 데이터 스케일을 선형대응 결과값을 출력
var newRamp = d3.scale.linear().domain([500000,13000000]).range(["blue","red"]);
document.getElementById("s_col_1").innerHTML = newRamp(1000000);    // 1000000 에 대응 bin을 출력
document.getElementById("s_col_2").innerHTML = newRamp(9000000);    // 9000000 에 대응 bin을 출력
document.getElementById("s_col_3").innerHTML = newRamp.invert("#ad0052"); // .invert()는 숫자만 가능
</script>

In [5]:
%%d3       
// 비닝('binning') : 데이터 분류
<p id='bin_1'></p>
<p id='bin_2'></p>
<p id='bin_3'></p>
<script>   
var sampleArray = [423, 124, 66, 424, 58, 10, 900, 44, 1]
var qScale = d3.scale.quantile().domain(sampleArray).range([0,1,2]);
document.getElementById("bin_1").innerHTML = qScale(423);
document.getElementById("bin_2").innerHTML = qScale(20);
document.getElementById("bin_3").innerHTML = qScale(10000);
</script>

In [6]:
%%d3       
// 비닝('binning') 2 : 데이터 분류
<p id='bin__1'></p>
<p id='bin__2'></p>
<p id='bin__3'></p>
<script>
var sampleArray = [423, 124, 66, 424, 58, 10, 900, 44, 1]
var qScaleName = d3.scale.quantile().domain(sampleArray).range(["small","medium","large"]);
document.getElementById("bin__1").innerHTML = qScaleName(68);
document.getElementById("bin__2").innerHTML = qScaleName(20);
document.getElementById("bin__3").innerHTML = qScaleName(10000);
</script>

In [7]:
%%d3       
// 내포함수 : d3.nest()
<p id='nest_1'></p>
<script>
d3.json('./data/tweets.json', function(data) {
    var tweetData = data.tweets;
    var nestedTweets = d3.nest()
                        .key(function(el) {return el.user})
                        .entires(tweetData);
    document.getElementById("nest_1").innerHTML = nestedTweets;
});
</script>

### <strong>05 데이터 측정
데이터를 로딩한 뒤 측정 후 정렬해야 한다

In [8]:
%%d3
<p id='min_'></p>
<p id='max_'></p>
<p id='mean_'></p>
<script>
var testArray = [88, 10000, 1, 75, 12, 35];
var min_ = d3.min(testArray, function(el) {return el}); // 배열의 최솟값을 호출
var max_ = d3.max(testArray, function(el) {return el});
var mean_ = d3.mean(testArray, function(el) {return el});

document.getElementById("min_").innerHTML = min_;
document.getElementById("max_").innerHTML = max_;
document.getElementById("mean_").innerHTML = mean_;
</script>

In [9]:
%%d3       
// 조금 더 복잡한 json 객체 배열을 활용
<p id='max_min'></p>
<script>
d3.csv('./data/cities.csv', function(data) {
    var max_min = [d3.min(data, function(el) {return +el.population}),
                   d3.max(data, function(el) {return +el.population}),
                   d3.mean(data, function(el) {return +el.population})];
    document.getElementById("max_min").innerHTML = max_min;    
})
</script> 

In [10]:
%%d3       
//  d3.extent() : 최대, 최솟값 array() 메서드
<p id='extent_'></p>
<script>
d3.csv('./data/cities.csv', function(data) {
    var max_min = d3.extent(data, function(el) {return +el.population});
    document.getElementById("extent_").innerHTML = max_min;
});
</script> 

<br>
## <strong>2 데이터 바인딩
loading -> format -> 측정 -> 생성 -> 갱신
### <strong>01 셀렉션과 바인딩
1. <strong>.select(), .selectAll()</strong> : DOM 요소선택, 본문에 요소가 없을땐 <strong>.enter()</strong>로 추가
1. <strong>.data()</strong> : DOM 요소에 배열을 연결
1. <strong>.enter()</strong> : <strong>.enter()</strong>는 DOM 보다 데이터가 더 많을때 공간을 넓히고, 
1. <strong>.enter()</strong> : <strong>.exit()</strong>는 데이터가 DOM 보다 적을 때 호출을 종료한다
1. <strong>.append(), .insert()</strong> : .append() 요소를 추가, .insert()는 요소추가 위치를 지정가능
1. <strong>.attr()</strong> : .append()추가 태그에 (class='cities') 속성이 자동적 추가된다
1. <strong>.html()</strong> : 전통적 DOM 요소의 콘텐츠 내용을 설정

In [11]:
%%d3
<g_2></g_2>
<script>
d3.csv("./data/cities.csv",
       function(error,data) { dataViz(data) });
       function dataViz(incomingData) {
            d3.select("g_2").selectAll("p.cities")   // g_2 태그 내부에 p 태그 없어서 '빈 셀렉션'선택
              .data(incomingData)                    // 데이터를 셀렉션에 binding
              .enter()                               // 셀렉션 DOM 보다 데이터가 더 많을 때
              .append("p")                           // 셀렉션 에 p tag 를 추가
              .attr("class","cities")                // 생성요소의 클래스 설정
              .html(function(d,i) {return d.label})} // p 의 입력 내용을 설정
</script>

### <strong>02 in-line 함수로 데이터 접근하기
array 배열의 key/ value를 사용하여 크기를 결정

In [12]:
%%d3  
// 1. 선 그리기
<svg id='no1'></svg>
<script>
d3.select("#no1")      // #id 로 DOM 요소를 선택
    .selectAll("rect") // "rect"를 선택, 없으면 생성한다
    .data([15, 50, 22, 8, 100, 10])
    .enter()
    .append('rect') 
    .attr('width', 10) //사각형의 너비를 고정된 값으로 입력
    .attr('height', function(d) {return d;});</script>

In [13]:
%%d3  
// 2. 선 그리기 + 색 입히기
<svg id='no2'></svg>
<script>
d3.select("#no2")   
    .selectAll("rect")
    .data([15, 50, 22, 8, 100, 10])
    .enter()
    .append('rect') 
    .attr('width', 10)
    .attr('height', function(d) {return d;})
    .style('fill','red')          // 그림을 채울 색을 정의
    .style('stroke', 'yellow')    // stroke 색을 정의
    .style('stroke-width','1px')
    .style('opacity', .25);
</script>

In [14]:
%%d3  
// 3. inline 함수에 '두번째'인자 추가 수정하기
<svg id='no3'></svg>
<script>
d3.select("#no3")
    .selectAll("rect")            
    .data([15, 50, 22, 8, 100, 80])
    .enter()
    .append('rect') 
    .attr('width', 10)
    .attr('height', function(h) {return h;})  
    .style('fill','red')
    .style('stroke', 'yellow')
    .style('stroke-width','1px')
    .style('opacity', .25)
    .attr('x', function(d,i) {return i * 10});  // 데이터의 i (index)를 덧붙여 출력
// ? Question!!
// h 는 어떻게 data[array] value 와 연결이 된건가?
// i 는 어떻게 data[array] key 와 연결이 된건가
</script>

In [15]:
%%d3  
// 4. graph를 X축 위로 뒤집어 올리기
<svg id='no4'></svg>
<script>
d3.select("#no4")                 
    .selectAll("rect")    
    .data([15, 50, 22, 8, 100, 80])
    .enter()
    .append('rect') 
    .attr('width', 10)    
    .attr('height', function(h) {return h;})
    .style('fill','red')
    .style('stroke', 'yellow')
    .style('stroke-width','1px')
    .style('opacity', .25)
    .attr('x', function(d,i) {return i * 10})  // 데이터의 i (index)를 덧붙여서 출력
    .attr('y', function(d) {return 100 - d});  // 데이터의 y 를 최대값에서 뺀 값으로 변환
// ? Question!!
// h 는 어떻게 data[array] value 와 연결이 된건가?
// i 는 어떻게 data[array] key 와 연결이 된건가
</script>

### <strong>03 스케일의 통합
실제 데이터값의 분산이 너무 클때

In [16]:
%%d3  
// 1. 데이터 분산이 큰 값을 기초로 그래프 그리기
<svg id='var1'></svg>
<script>
d3.select("#var1")     
    .selectAll("rect") 
    .data([14, 68, 24500, 430, 19, 1000, 5555])
    .enter()
    .append('rect') 
    .attr('width', 10)
    .attr('height', function(d) {return d})
    .style('fill', 'red')
    .style('stroke', 'yellow')
    .style('stroke-width', '1px')
    .style('opacity', .25)
    .attr('x', function(d,i) {return i * 10;})
    .attr('y', function(d) {return 100 -d});
// 100 이외에는 구분 못하는 그래프를 출력 </script> 

In [17]:
%%d3  
// 2. Y 오프셋을 최대값 적용
<svg id='var2'></svg>
<script>
d3.select("#var2")     
    .selectAll("rect") 
    .data([14, 68, 24500, 430, 19, 1000, 5555])
    .enter()
    .append('rect') 
    .attr('width', 10)
    .attr('height', function(d) {return d})
    .style('fill', 'red')
    .style('stroke', 'yellow')
    .style('stroke-width', '1px')
    .style('opacity', .25)
    .attr('x', function(d,i) {return i * 10;})
    .attr('y', function(d) {return 24500 -d});
// 가장 긴 그래프만 출력될 뿐 나머지는 출력되지 않는다 </script>

In [18]:
%%d3  
// 3. 스케일러로 보정한 값으로 그림 그리기
<svg id='var3'></svg>
<script>
var yScale = d3.scale.linear().domain([0, 24500]).range([0,100]);
d3.select("#var3")     
    .selectAll("rect") 
    .data([14, 68, 24500, 430, 19, 1000, 5555])
    .enter()
    .append('rect') 
    .attr('width', 10)
    .attr('height', function(d) {return yScale(d);})
    .style('fill', 'red')
    .style('stroke', 'yellow')
    .style('stroke-width', '1px')
    .style('opacity', .25)
    .attr('x', function(d,i) {return i * 10;})
    .attr('y', function(d) {return 100 -yScale(d);});
// 데이터 스케일을 변환한 크기값으로 그래프를 그린다 </script>

In [19]:
%%d3  
// 4. 스케일러를 세분화한 결과값을 사용하여 그림 그리기
<svg id='var4'></svg>
<script>
var yScale = d3.scale.linear().domain([0,100,1000, 24500]).range([0,50,75,100]);
d3.select("#var4")     
    .selectAll("rect") 
    .data([14, 68, 24500, 430, 19, 1000, 5555])
    .enter()
    .append('rect') 
    .attr('width', 10)
    .attr('height', function(d) {return yScale(d);})
    .style('fill', 'red')
    .style('stroke', 'yellow')
    .style('stroke-width', '1px')
    .style('opacity', .25)
    .attr('x', function(d,i) {return i * 10;})
    .attr('y', function(d) {return 100 -yScale(d);});
// 데이터 스케일을 변환한 크기값으로 그래프를 그린다 </script>

In [20]:
%%d3  
// 5. 0 ~ 500 구간만 확대하여 시각화 하는 경우
<svg id='var4'></svg>
<script>
var yScale = d3.scale.linear().domain([0,100,500]).range([0,50,100]);
d3.select("#var4")     
    .selectAll("rect") 
    .data([14, 68, 24500, 430, 19, 1000, 5555])
    .enter()
    .append('rect') 
    .attr('width', 10)
    .attr('height', function(d) {return yScale(d);})
    .style('fill', 'red')
    .style('stroke', 'yellow')
    .style('stroke-width', '1px')
    .style('opacity', .25)
    .attr('x', function(d,i) {return i * 10;})
    .attr('y', function(d) {return 100 -yScale(d);});
// alert(yScale(1000));  // 500이 넘어가는 값은 100이상의 값을 출력한다
// 데이터 스케일을 변환한 크기값으로 그래프를 그린다 </script>

<br>
## <strong>3 데이터 표현 스타일, 속성, 콘텐츠
그래프들의 속성을 설정하는 방법을 익히고, D3에서의 요소 생성,삭제,변경에 대해 알아본다
### <strong>01 로딩된 데이터를 시각화
CSV 데이터를 기반으로 막대그래프 구현하기

In [21]:
%%d3  
// 5. 0 ~ 500 구간만 확대하여 시각화 하는 경우
<svg id='csv1'>
</svg>
<script>
d3.csv("./data/cities.csv", function(error,data) {dataViz(data);});

function dataViz(incomingData) {
        var maxPopulation = d3.max(incomingData, function(el) {
            return parseInt(el.population);} // 인구값을 정수로 변환하여 출력
);
    var yScale = d3.scale.linear().domain([0,maxPopulation]).range([0,200]);
    d3.select("#csv1")
      .attr("style","height: 480px; width: 600px;");
    d3.select("#csv1")
      .selectAll("rect")
      .data(incomingData)
      .enter()
      .append("rect")
      .attr("width", 50)
      .attr("height", function(d) {return yScale(parseInt(d.population));})
      .attr("x", function(d,i) {return i * 60;})
      .attr("y", function(d) {return 200 - yScale(parseInt(d.population));})
      .style("fill", "red")
      .style("stroke", "yellow")
      .style("stroke-width", "1px")
      .style("opacity", .25); }
// alert(yScale(1000));  // 500이 넘어가는 값은 100이상의 값을 출력한다
// 데이터 스케일을 변환한 크기값으로 그래프를 그린다 </script>

In [22]:
# d3.json("tweets.json",function(error,data) {dataViz(data.tweets)});
# function dataViz(incomingData) {
# var nestedTweets = d3.nest()
# .key(function (el) {return el.user;})
# .entries(incomingData);
# nestedTweets.forEach(function (el) {
# el.numTweets = el.values.length;
# })
# var maxTweets = d3.max(nestedTweets, function(el) {return el.numTweets;});
# var yScale = d3.scale.linear().domain([0,maxTweets]).range([0,100]);
# d3.select("svg")
# .selectAll("rect")
# .data(nestedTweets)
# .enter()
# .append("rect")
# .attr("width", 50)
#     .attr("height", function(d) {return yScale(d.numTweets);})
# .attr("x", function(d,i) {return i * 60;})
# .attr("y", function(d) {return 100 - yScale(d.numTweets);})
# .style("fill", "blue")
# .style("stroke", "red")
# .style("stroke-width", "1px").style("opacity", .25);
# }