Đây là lý do tại sao nhiều nhà khoa học dữ liệu (data scientists) đang bỏ việc

Người dịch : nghiahsgs
GHi chú: Bài viết nằm trong dự án dịch tiếng anh hàng ngày của nghiahsgs. Bên cạnh đó cũng mang được giá trị gì đó cho bạn đọc
Thất vọng về khoa học dữ liệu

Vâng tôi đang là 1 nhà khoa học dữ liệu và vâng, bạn đang đọc tiêu đề chính xác, nhưng ai đó đã nói nó. Chúng ta đọc rất nhiều bài viết về khoa học dữ liệu là công việc hấp dẫn nhất thế kỷ 21 và số tiền hấp dẫn mà bạn có thể kiếm được khi làm 1 nhà khoa học dữ liệu, nó dường như đây là công việc trong mơ. Nhân tố trong lĩnh vực này bao gồm những người có kỹ thuật phong phú nhìn ra cách giải quyết vấn đề phức tạp (Vâng đó là thứ tích cực để nhìn ra), có tất cả mọi thứ để yêu công việc này.

Nhưng sự thuật là các nhà khoa học dữ liệu điển hình dành 1-2 tiếng trong tuần tìm một công việc mới như được nhắc đến trong bài báo này. Thêm nữa bài báo cũng nêu rằng “Chuyên ngành machine learning đứng đầu danh sách của các lập trình viên, những người đang tìm kiếm công việc mới ở mắc 14.3 %” Những dữ liệu thống kê này được thu thập bởi stack overflow trong khảo sát của họ dựa trên 64000 lập trình viên.

Vậy tại sao nhiều nhà khoa học dữ liệu tìm kiếm công việc mới ?

Trước khi tôi trả lời câu hỏi đó, tôi nên làm rõ là hiện tại tôi vẫn đang là một nhà khoa học dữ liệu. Tôi yêu công việc này và tôi không muốn ngăn cản người khác từ tham vọng để trở thành một nhà khoa học dữ liệu vì nó có thể vui, kích thích và bổ ích. Mục tiêu của bài báo này là để phơi bày một vài khía cạnh tiêu cực của công việc này.

Từ khía cạnh của tôi, có 4 lý do lớn tại sao tôi nghĩ nhiều nhà khoa học dữ liệu không thỏa mãn với công việc của họ

1. Sự kỳ vọng không khớp với thực tế

Dữ liệu lớn giống như tình dục tuổi teen : mọi người nói về nó, không ai thực sự biết làm thế nào để làm, mọi người nghĩ người khác đang làm nó, và vì vậy mọi người tuyên bố họ đang làm nó Dan Ariely.

Câu nói này rất thích hợp. Nhiều nhà khoa học nghiệp dư tôi biết (nó bao gồm tôi) muốn đi vào lĩnh vực khoa học dữ liệu vì nó nói về giải các vấn đề phức tạp với những thuật toán cool ngầu, và nó ảnh hưởng lớn đến kinh doanh. Nó là cơ hội để cảm thấy như công việc chúng ta đang làm quan trọng hơn bất cứ cái gì chúng ta đã làm trước đó.

Trên quan điểm của tôi, sự thật rằng kỳ vọng không khớp với thực tế là lý do cuối cùng tại sao nhiều nhà khoa học dữ liệu từ bỏ công việc. Có nhiều lý do cho nó và tôi không thể đưa ra một danh sách nhưng bài viết này là 1 danh sách các lý do tôi gặp được.

Tất cả các công ty là khác nhau nên tôi không thể nói cho tất cả nhưng nhiều công ty thuê nhà khoa học dữ liệu mà không có cơ sở hạ tầng phù hợp để bắt đầu lấy các giá trị từ AI. Điều này đóng góp đến vấn đề lạnh trong AI. Kết hợp với điều này là sự thật rằng các công ty thất bại trong việc thuê lập trình AI có kinh nghiệm trước khi thuê AI ngiệp dư, bây giờ bạn đã có công thức cho sự vỡ mộng và sự không vui vẻ cho mối quan hệ các bên. Các nhà khoa học dữ liệu có thể đã đến để vieesrt các thuật toán machine learning thông minh để có các cái nhìn về dữ liệu nhưng họ không thể làm vì công việc đầu tiên của họ là sắp xếp dữ liệu hoặc tạo báo cáo phân tích. Ngược lại,công ty chỉ muốn một biểu đồ họ có thể trình bày mỗi ngày. Công ty thấy khó chịu vì họ không nhìn thấy giá trị được mang đến ngay tức khắc và tất cả dẫn đến các nhà khoa học dữ liệu cảm thấy không vui trong vai trò của họ.

Robert Change đã đưa ra một câu châm ngôn hữu ích trên blog của anh ấy, đưa ra lời khuyên cho các nhà khoa học dữ liệu nghiệp dư:

Nó là quan trọng để đánh giá tốt như thế nào cảm hứng của chúng ta điều chỉnh với con đường quan trọng của môi trường chúng ta đang đi. Tìm kiếm dự án, đội nhóm và công ty có con đường quan trọng với bạn.

Điều này nhấn mạnh quan hệ 2 chiều giữa ông chủ và các nhà khoa học dữ liệu. Nếu công ty không ở vị trí đúng hoặc có một đích phù hợp với mục đích của các nhà khoa học dữ liệu thì nó chỉ là vấn đề thời gian trước khi nhà khoa học dữ liệu tìm một cái gì đó khác.

Cho những người quan tâm Samso HUb, nó có một chuỗi tuyệt vời trên cách một team phân tích được xây dựng ở Wish, tôi cũng tìm được điều thú vị

Lý do khác các nhà khoa học dữ liệu vỡ mộng là lý do tương tự tại sao tôi vỡ mộng với học viện : Tôi tin rằng tôi có thể tạo ảnh hưởng lớn với mọi người mọi nơi, không chỉ trong công ty này. Trong thực tế, nếu lõi kinh doanh của công ty không phải là machine learning (Ông chủ cũ của tôi là công ty sản xuất truyền thông), nó như là nhà khoa học dữ liệu chỉ cung cấp một phần nhỏ giá trị. Nó có thể thêm vào cái gì đó rất quan trọng hoặc bạn có thể may mắn vấp vào dự án đào vàng nhưng đó là điều không dễ gặp.

2. Chính trị tối cao

Vấn đề của chính trị đã có một bài báo tuyệt vời nói đến : Những thứ khó nhất trong khoa học dữ liệu là chính trị và tôi thúc bạn nên đọc nó. Một vài câu đầu tiên từ bài báo đó khá nhiều thứ tôi muốn nói

Khi tôi dậy 6h sáng để học Support Vector Machines tôi nghĩ : “nó thực sự khó khăn, nhưng ít nhất tôi sẽ trở thành giá trị hơn cho ông chủ tương lai của tôi” Nếu tôi có thể có Delorean , tôi sẽ quay ngược thời gian về đó và chửi tôi.

Nếu bạn nghiêm túc nghĩ rằng biết nhiều thuật toán machine learning vẽ làm bạn trở thành nhà khoa học dữ liệu nhiều giá trị, hãy quay lại luận điểm một : kỳ vọng éo như thực tế.

Sự thực là mọi người trong kinh doanh cần 1 nhận thức cao về bạn. Nó có nghĩ rằng bạn bạn phải liên tục làm các việc như lấy số liệu từ database để đưa cho đúng người đúng thời điểm, làm những dự án đơn giản chỉ để những người có nhận thức đúng về bạn. Tôi đã làm nó nhiều trong vị trí trước đó. Dù bực tức nhưng là một phần của công việc

3) Bạn là người trực tiếp với bất cứ dữ liệu nào

Làm bất cứ việc gì để hài lòng đúng người, những người với sự ảnh hưởng thường không hiểu cái gì được gọi là nhà khoa học dữ liệu. Nó nghĩ rằng bạn sẽ là chuyên pha phân tích cũng như một gã chuyên báo cáo, đừng quên rằng bạn cũng sẽ là một chuyên gia cơ sở dữ liệu.

Nó không phải việc thực thi không cần công nghệ, nó làm nhiều giả sử về kỹ năng của bạn. Ở trường học công nghệ giả sử bạn đã biết mọi thứ liên quan dữ liệu. Bạn biết cách của bạn xung quanh Spark, Hadoop, Hive, Pig, SQL, Neo4J, MySQL, Python, R, Scala, Tensorflow, A/B Testing, NLP,  bất thứ cái gì machine learning (và bất cứ gì khác liên quan)

Nhưng nó không dừng ở đây. Bởi vì bạn biết tât cả và bạn rõ ràng phải truy cập tất cả dữ liệu, bạn được mong chờ để trả lời tât cả các câu hỏi bởi …

Cố gắng nói với tất cả mọi người cái bạn thực sự biết và có sự kiểm soát là khó. Không bởi vì ai đó sẽ thực sự nghĩ iys về bạn nhưng vì một nhà khoa học dữ liệu nghiệp dư với 1 ít kinh nghiệm công nghiệp, bạn sẽ lo lắng về bọn nghười sẽ nghĩ ít về bạn. Nó có thể là tình huống khó xử.

4) Làm việc ở một team bị cô lập

Khi bạn nhìn thấy các sản phẩm thành công, chúng ta thường nhìn giao diện người dùng tuyệ vời. Bây giờ nếu nhà khoa học dữ liệu dành thời gian của bạn chỉ học cách viết và thực thi thuật toán, và sau đó họ có thể chỉ là một phần nhỏ của team dẫn đến 1 sản phẩm thành công. Nó có nghĩa rằng đội ngũ ai làm việc cô lập với sự đấu tranh cung cấp giá trị.

Mặc dù thế, nhiều công ty vẫn có đội ngũ khoa học dữ liệu đến với dự án của họ và viết code để thử và giải vấn đề. Trong một số trường hợp, nó có thể đủ. Ví dụ nếu tât cả cần là bảng tính tĩnh, nó được sản suất 1 lần trong 1 quý, nó có thể cung cấp vài giá trị. Ở khía cạnh khác, nếu mục tiêu là tối ưu cung cấp gợi ý thông minh cho 1 website, và sau đó nó có thể liên quan đến những kỹ năng không được mong muốn (chỉ các nhà khoa học dữ liệu thực sự mới có thể giải nó). Nên nó được thực hiện bởi các đội ngũ khoa học dữ liệu độc lập thì nó sẽ thất bại

Nên trở thành một nhà khoa học dữ liệu hiệu quả trong công nghiệp là không đủ , chỉ để thắng trong các cuộc thi Kaggle và hoàn thành vài khóa học online. Tìm một công ty phù hợp với con đường quan trọng của bạn nên là mục tiêu chính khi tìm kiếm một công việc khoa học dữ liệu sẽ đáp ứng nhu cầu của bạn. Tuy nhiên, bạn vẫn có thể cần điều chỉnh lại những kỳ vọng của mình về những gì mong đợi từ vai trò khoa học dữ liệu.

Nếu bất cứ ai có bất kỳ nhận xét, câu hỏi hoặc phản đối bổ sung nào, xin vui lòng bình luận vì thảo luận mang tính xây dựng là cần thiết để giúp các nhà khoa học dữ liệu khao khát đưa ra quyết định sáng suốt về con đường sự nghiệp của họ.

Hy vọng đọc xong không làm bạn bỏ việc
Cảm ơn bạn đã đọc 🙂

Leave a Comment