미국의 매춘 : 데이터

제가 여러분과 공유하게 된 데이터 저널리즘 연습

베네치아 카니발의 가면 (출처 : Wikipedia)

참고 : 이것은 여러 분할 중 첫 번째입니다. 1 부 (이 부분은) 데이터 집합을 탐구, 일부는 성 노동자의 민족에서 2 외모 , 서비스의 일부 3 외모를 수행하고 민족이 상관 관계는 방법 , 파트 4 가지의 경제적 측면 외모와는 어떻게 비용은 인종에 상관 관계 성 노동자의 서비스와 외모 .

사람들 (대부분 남성)이 다른 고객의 이익을 위해 성 노동자 (대부분 여성)를 리뷰하는 웹 사이트 (TER 약어로 이동)가 있습니다. 저는 이것을 데이터 저널리즘과 시각적 스토리 텔링의 연습으로 사용할 수 있다고 생각했습니다.이 두 가지 주제는 저를위한 시간이 많지는 않지만 한동안 저를 흥미로 웠습니다. (저의 일은 완전히 다른 산업에 있습니다).

중요 참고 사항 : 매춘의 주제가 매우 민감하고 많은 사람들에게 민감 할 수 있음을 완전히 알고 있습니다. 페미니스트들은이 문제에 대해 분열되어 있습니다. 어떤 사람들은 이것이 여성을 착취하는 남성의 가장 큰 예라고 주장 할 것이고, 다른 사람들은 폭력과 인신 매매가 배제 된 경우, 누구도 독립적 인 여성에게 자신이해야 할 일을 말할 권리가 없다고 주장 할 것입니다. 시체. 그들이 선택하는 한, 그들은 지루한 부유 한 사람들로부터 돈을 자유롭게 얻고 그 돈을 항상 고통받는 경제에 되돌려 놓을 수 있습니다.
이 블로그의 목적을 위해 저는 거기에 가지 않을 것입니다. 내가 수집하고 "정리"하고 정리 한 데이터 만 설명하겠습니다. 가능한 많은 내러티브를 배제하십시오.

데이터 세트를 탐색하고 지저분한 데이터를 정리해 보겠습니다.

처음에 프로젝트에서 가장 어려운 부분은 TER 사용자가 지난 4 년 동안 멋진 표 형식으로 제공 한 귀중한 데이터를 확보하는 것이 었습니다.

저는 기술 자라서 그 장애물을 극복했습니다. 불행히도 (아니면 아닐 수도 있습니다) 그것은 시작에 불과했습니다. 데이터가 의미있는보기를 추출하고 "사과 간"비교를 허용하기 위해 많은 양의 삭제가 필요했기 때문에 제가 흥정했던 것보다 조금 더 많은 것을 얻었습니다. 그러나 그것은 매우 유익했습니다.

TER 데이터를 분석하기 위해 전 세계 데이터 과학자들이 선택한 도구 중 하나 인 Jupy ter (말장난 의도 없음) Notebook 을 사용하기로 결정했습니다 .

데이터를 얻는 방법에 대한 자세한 내용은 다루지 않겠지 만 저를 믿으세요. 멋진 TSV 파일로 가져 왔습니다.

데이터를 처음으로
TER ID를 데이터 세트의 인덱스로 만들어 보겠습니다.
꽤 흥미로운 분야
데이터 세트가 깔끔해 보이기 시작합니다

이제 데이터가 좀 더 깔끔해 보입니다. 그것과 함께 일하는 것은 기쁨이 될 것입니다.

참고 : DataViz에 사용한 MatPlotLeab / Seaborn 명령뿐만 아니라 데이터를 분할하고 주사위를 던지는 데 사용한 Python / Pandas 코드를 보여 드리겠습니다. 의견 수정 및 질문을 환영합니다.

남자와 인형

먼저 인형 사이에 얼마나 많은 친구들이나 전 친구들 (성전환자)이 숨어 있는지 살펴 보겠습니다. 다행히도 해당 정보를 제공하는 필드가 있습니다. 시각화가 쉽기 때문에 놀라운 일은 없습니다. 약 2 %.

프로필의 약 2 %가 성전환자입니다.

세상의 놈들이 단결!

그 새끼들이 숨어있는 곳을 살펴 보겠습니다 (이번에는 말장난).

솔직히 말해서 미국 대도시가 목록 상단에 표시 될만큼 중요한 대도시 지역을 항상 포함하지는 않기 때문에 일부 통합을 사용할 수 있습니다. 에디슨, 뉴저지, 브루클린, 뉴욕 대 NYC, 타이슨 스 코너와 페어팩스 대 워싱턴 DC를 생각하고 있습니다. (그리고 분명히 말해서, 나는 DC에있는 새끼들이 다른 나라들과 비교하여 불균형적인 재미를 가지고 있다는 것을 암시하려는 것이 아닙니다…

plt.figure(figsize=(10,18))
frame[‘City’].value_counts()[:40].plot(kind=”barh”);

Top 40 cities (could use some additional consolidation for main metro areas)

국가 수준을 볼 수 있다면 좋을 것입니다. 데이터를 정규화하려면 여기서 약간의 수동 작업이 필요합니다. 세부 사항에 대해서는 지루하지 않을 것입니다. "데이터 사용자"는 다음에서 내가 한 일을 이해할 수 있습니다.

주 및 국가 데이터를 자체 열로 추출

미국인들이 전국적으로 어떻게이 문제에 접근하는지 살펴 보겠습니다.

당연히 캘리포니아에는 많은 교정이 진행되고 있습니다. 동시에, 몬태나에있는 사람들은 많이 올라 오지 않는 것 같습니다.

캘리포니아, 뉴욕 주 및 플로리다는 빌어 먹을에 관한 한 최고의 주입니다.

워싱턴 DC는 규모를 고려할 때 불균형 적으로 높은 위치에 있습니다. 성 노동에있어 크기가 중요하지 않다고 결론을 내릴까요?

주목할만한 점 : 버지니아에는 처녀가 그다지 많지 않은 것 같습니다.

다른 나라는 어떻습니까?

TER는 미국 웹 사이트입니다. 압도적 인 대다수의 데이터가 미국을 참조 할 것으로 예상 할 수 있습니다. 빠른 쿼리 (빠른 질문?)는 데이터의 90 % 정도가 실제로 미국을 참조한다는 것을 보여줍니다.

plt.figure(figsize=(10,6))
frame['Country'].value_counts()[:10].plot(kind="barh");
Our dataset represents the US situation overwhelmingly

지금은 그게 다입니다. 다음 기사에서는 인종부터 시작하여 성 노동자 (TER 용어로 일명 제공자)를 살펴볼 것입니다.

파트 2 : 제공자의 민족

Suggested posts

여성의 것이 아닙니다 : 안티 컷 싸움에서 선두에있는 남성

여성의 것이 아닙니다 : 안티 컷 싸움에서 선두에있는 남성

Diana Kendi 작성 자라면서 Tony Mwebia는 여성 생식기 절단 (FGM)에 반대하는 캠페인을 벌일 것이라고는 생각하지 못했습니다. 서른 살의 Tony는 Meru 카운티의 South Imenti의 Kinoro Village에서 태어나 자랐으며 FGM을 실천하는 지역 사회 출신이지만 큰 문제로 보지 못했습니다.

미국의 섹스 문제는 여성을 죽이는 것입니다.

미국의 섹스 문제는 여성을 죽이는 것입니다.

“성 노동자와의 전쟁”을 끝내는 것이 유일한 해결책입니다. 조지아의 추운 화요일 저녁, 3 개의 다른 마사지 가게에서 8 명의 목숨이 비극적으로 단축되었습니다.