PhD life 1: Quá trình viết và nhận xét các bài báo khoa học



1. Review papers

Khi học PhD, chúng tôi có thể phải làm một nhiệm vụ là review các paper được viết bởi các tác giả khác.

Dạo này chậm ra bài, tôi xin chia sẻ với các bạn một chút về cuộc sống PhD của mình. Hy vọng giúp các bạn hiểu thêm về cuộc sống của những người làm nghiên cứu như tôi. Một chút xíu thôi.

1.1. Associate Editor

Thông thường, khi nộp một paper lên các tạp chí, paper đó sẽ được chuyển tới một Associate Editor (AE). AE này sẽ ‘nhờ’ khoảng 3 reviewers để ‘chấm điểm’ cho paper này. Giáo sư hướng dẫn của tôi là AE cho một vài tạp chí lớn. Và tôi đã bị ‘chỉ định’ làm reviewer cho khoảng trên dưới 30 bài transaction. Một vài trong số đó là các paper hay, phần lớn là các paper tệ. Tỉ lệ acceptance của các tạp chí này cũng thấp (1/6-1/4) nên đó cũng là chuyện dễ hiểu. Vì thế, tôi cũng không thích review lắm vì khá mất thời gian.

Những reviewers được AE ‘mời’ sẽ được giấu tên, chỉ có AE mới biết mỗi reviewer này ai. Sau khi hoàn tất review một bài báo, AE sẽ rate các reviewers. Như vậy là sẽ có một bảng ranking của các reviewer ở đâu đó. Lần tới, một AE khác sẽ lựa chọn từ bảng ranking đó và tìm các reviewers có background liên quan để mời review.

Để có những nhận xét đa chiều, giáo sư của tôi thường chọn 3 đối tượng reviewers: 1. Senior PhDs, tức những sinh viên PhD như tôi đã có bài báo được published; 2. Những sinh viên PhD mới tốt nghiệp được vài năm, thường là Postdoc; 3. Các giáo sư khác hoặc những người làm nghiên cứu lâu năm. Ba nhóm reviewers này thường có những cách đánh giá khác nhau.

Nhóm thứ nhất thường để ý tới các phương trình toán, kiểm tra chính tả ngữ pháp các kiểu. Ban đầu vì chưa có kinh nghiệm nên tôi kiểm tra các phương trình rất kỹ xem có lỗi gì không. Vì chẳng lẽ mình review mà không viết được cái gì :D. Một điểm cũng rất lo lắng là liệu quyết định của mình có lệch quá so với các reviewers khác không (mình cho Chấp nhận mà những người khác cho Từ chối thì cũng không được).

Nhóm thứ ba thường quan tâm tới bức tranh lớn (big picute). Họ thường quan tâm tới ý tưởng chính của paper và đưa ra nhận xét. Họ cũng biết nhiều các paper khác nên việc kiểm chứng novelty của paper cũng là việc tương đối đơn giản. Các bác này có lẽ không đọc các phương trình làm gì. Nhớm thứ hai thì có cái nhìn ở giữa nhóm thứ nhất và thứ ba.

1.2. Các quyết định của Associate Editor

Dựa trên bình luận và quyết định của các reviewer, AE sẽ ra quyết định cuối cùng, thường có mấy lựa chọn sau:

  1. Chấp nhận (A - Publish Unaltered)
  2. Chấp nhận với chỉnh sửa nhỏ (AQ - Minor revision)
  3. Chỉnh sửa lớn (RQ - Major revision)
  4. Từ chối ngay (R - Reject)

Rất ít khi có một paper được A ngay ở lần nộp đầu tiên, thậm chí là AQ. Các reviewer bao giờ cũng cố tìm ra một điểm nào đó để ‘khuyên’ tác giả thay đổi một chút. Cũng gọi là có công của mình trong quá trình review.

Tần số để 1 paper nhận R ngay từ lần đầu cao hơn một chút nếu paper không có điểm gì mới, tiếng Anh tệ, các công thức toán không rõ ràng, hoặc/và hình vẽ không rõ ràng.

Chủ yếu các paper sẽ nhận được RQ từ vòng đầu, tức yêu cầu thay đổi và trả lời các câu hỏi của reviewers trước khi có quyết định ở vòng tiếp theo từ AE. Các tạp chí lớn thường không cho phép 2 lần RQ liên tiếp. RQ hai lần liên tiếp là sẽ coi như bị R.

1.3. Các tiêu chí đánh giá

Các tiêu chí để đánh giá một paper thường là:

  • Importance / Relevance: Chủ đề của bài báo có phù hợp với tạp chí không.
  • Novelty: ý tưởng trong bài báo có mới không, có lặp lại hoặc được xào nấu từ các bài báo trước đây không.
  • Clarity of Presentation: Cách trình bày có rõ ràng, khoa học, dễ hiểu không. Các hình vẽ, bảng, biểu đồ có giúp người đọc hiểu rõ hơn về bài báo hay không.
  • Experimental Validation: Các kết quả thực nghiệm có chứng minh rằng ý tưởng của bài báo là tốt không.
  • Technical Correctness: Các vấn đề kỹ thuật được nêu trong bài báo có chuẩn xác không. Việc này bao gồm cả các công thức toán.

Tiêu chuẩn mà tôi thấy khó đánh giá nhất là Novelty. Ranh giới giữa ‘simple but effective’ và ‘minor novelty/ not original’ là rất mong manh. Nhiều khi việc cải tiến một chút xíu làm cho một mô hình nổi tiếng khác đơn giản hơn làm cho hệ thống hoạt động khá hiệu quả. Nhưng ngược lại, việc đó cũng có thể được coi là ‘không có tính sáng tạo, không có gì mới’. Việc này tuỳ thuộc rất nhiều vào trạng thái tâm lý tình cảm của reviewer.

Ngày mới làm review, tôi thường đọc bài rất kỹ. Tôi xem ý tưởng có bị lặp không, các công thức có sai sót gì không, hình vẽ có đẹp không :D, tiếng Anh có phải sửa không, … Thậm chí, tôi còn quan tâm tới việc paper có được soạn thảo bằng LaTeX hay không (đọc các công thức toán được soạn bằng Word rất là nản, xin lỗi các bạn). Và tôi từng là một ‘tough reviewer’, cho rất nhiều bài RQ hoặc R. Thật là có lỗi.

Hôm nay tôi review một bài ở một tạp chí cũng tương đối lớn (một bài Signal Processing Letter). Bài này tôi đã từng review và cho R. Đây là bài nộp lại kèm theo phản hồi tới những comments của tôi ở lần review trước.

Ý tưởng của bài này rất đơn giản, chỉ sửa một chút và việc sửa này cũng không có gì là sáng tạo, chỉ là vay mượn từ các mô hình khác. Quả thật, nghĩ ra một cái hoàn toàn mới là cực kỳ khó! Ở lần review thứ nhất cách đây 2 tháng, tôi đã cho R cũng vì tính ‘not novel’ này. Nhưng hôm nay nhân một ngày mát trời, sau khi đọc lại rất kỹ paper này, tôi đã quyết định cho AQ. Tôi cũng nói riêng với AE rằng tôi thay đổi quyết định từ R lên AQ vì ý tưởng của bài báo rất đơn giản nhưng đã giúp cho mô hình linh hoạt và thời gian huấn luyện giảm đi khá nhiều, đồng thời kết quả cũng tốt. Tôi chưa cho A vì kết quả chưa được mô tả đẹp lắm. Có một vài bảng kết quả nên được vẽ dưới dạng biểu đồ cột.

Các tác giả đã may mắn vì hôm nay chỗ tôi có một cơn mưa rào lớn lúc chập tối.

Ranh giới giữa Chấp nhận và Từ chối đôi khi rất mong manh, có thể phụ thuộc vào thời tiết. Cùng một ý tưởng, cùng một kết quả nhưng cách viết thế nào cũng rất quan trọng.

2. Viết papers

Điều kiện để chúng tôi tốt nghiệp bậc học PhD là phải có một lượng các bài báo khoa học. Tuỳ từng trường, tuỳ từng thầy mà yêu cầu về số lượng tối thiểu các bài báo là khác nhau. Trong lab của tôi, chúng tôi cần ba bài journal papers. Tại thời điểm bảo vệ tốt nghiệp, chúng tôi cần có ít nhất hai bài đã được chấp nhận và một bài đã được nộp chờ phản hồi.

Có hai loại bài báo khoa học chính: conference papers và journal/transaction papers. Hiểu một cách đơn giản, conference papers là các papers được nộp vào các hội nghị khoa học. Sau khi bài báo được chấp nhận, chúng tôi cần đến tham dự hội nghị đó và trình bày về bài báo, thường dưới dạng poster hoặc lecture presentation. Tôi sẽ nói về hài loại presentations này khi có dịp. Về độ dài, thường có hai loại: 4 trang + 1 trang references hoặc 8 trang + 1 trang references. Trong bài viết này, tôi sẽ viết về loại 4 trang + 1. Loại 8 trang + 1 hoặc dài hơn sẽ khó hơn nhiều, thậm chí còn khó hơn journal.

Journal papers là các bài được nộp vào các tạp chí khoa học. Chúng tôi không cần đến dự hội nghị nào mà chỉ cần nộp và qua một vài lần nhận xét. Sau đó AE ra quyết định xem bài có được chấp nhận hay không.

Bảng dưới đây mô tả sự khác nhau cơ bản giữa loại conference paper (4 trang + 1) và journal paper.

  Conference paper Journal paper
Độ dài (tối đa) 4 trang + 1 > 10 trang
Deadline thường là 1 năm 1 lần không có deadline
Số vòng đánh giá thường là 1 có thể nhiều hơn 1
Thời gian để biết kết quả ~ 3-4 tháng 6 tháng - 1 năm, hoặc hơn
Độ khó dễ hơn khó hơn
Yêu cầu chất lượng thấp hơn cao hơn


Với mỗi một ý tưởng, cái đích cuối cùng của chúng tôi là viết một journal paper. Trên đường tới đích, chúng tôi cần viết 1 bài conference cho cùng ý tưởng đó.

Cho tới khi viết journal paper, chúng tôi thường phải trình bày ý tưởng của mình nhiều lần trong và ngoài lab.

Quá trình viết một journal paper thường gồm 3 giai đoạn.

2.1. Giai đoạn 1: Lên ý tưởng và trình bày trong và ngoài lab

Ở trong lab, chúng tôi có Group Meetings (GM) được tổ chức hàng tuần vào chiều Thứ Sáu. Mỗi tuần sẽ có 1-2 thành viên trong lab trình bày về công việc mình đang làm trước giáo sư và toàn lab. Trừ người trình bày, chúng tôi thường rất thích các buổi GM này vì cả lab được gặp nhau và ngồi dưới bắt nạt người trình bày. Chúng tôi được khuyến khích đặt câu hỏi để sự tương tác giữa các thành viên vào 1 vấn đề lớn hơn.

Ngay khi có ý tưởng, tôi thường nóng lòng xin giáo sư cho trình bày trong lần GM trống gần nhất. Vì khi có ý tưởng mới là lúc chúng ta cảm thấy ‘excited’ nhất, muốn chia sẻ nhất để xem mọi người nhận xét thế nào.

Ở lần trình bày thứ nhất, thường là đề xuất ý tưởng, chúng tôi sẽ nhận được phản hồi từ giáo sư về tính novelty và tính khả thi của ý tưởng. Nếu mọi việc thuận lợi, chúng tôi sẽ làm experiment và trình bày thêm khoảng 1-2 lần nữa. Sau khi có kết quả, chúng tôi sẽ quyết định nộp bài vào conference nào cho kịp thời gian. Đồng thời, cũng phải lựa xem phần nào nên viết trong conference, phần nào nên để lại cho journal. Journal paper, mặc dù được phát triển từ conference paper, cần có những điểm mới riêng biệt mà conference paper không có.

Nếu có dịp, ví dụ như các hội nghị sinh viên nghiên cứu khoa học ở trường, chúng tôi sẽ mang ý tưởng ra trình bày và nhận các phản hồi trong trường. Phần này thường không mang nhiều ý nghĩa vì trong trường thường ít người biết về nghiên cứu của chúng tôi.

2.2. Giai đoạn 2: conference paper

Với conference paper, vì là một bài ngắn nên paper chủ yếu là chia sẻ ý tưởng và một vài kết quả cơ bản. Sau khi nộp bài cho conference, chúng tôi phải bắt tay vào làm thêm experiment, phân tích thuật toán, cải thiện tốc độ và thêm một vài chứng minh toán cần thiết. Và hy vọng bài conference paper vừa nộp được Chấp nhận.

Thật may mắn cho tôi là các papers của tôi chưa bao giờ bị Từ chối.

Sau 3-4 tháng kể từ nộp, tới khi nhận được kết quả của bài conference, tôi sẽ nhận được các nhận xét của các reviewers. Dựa trên các nhận xét đó, tôi bắt tay vào lên dàn ý và bắt đầu viết journal paper. Lý tưởng nhất, tới khi conference diễn ra, thường là 3-4 tháng nữa sau đó, tôi phải hoàn thành bản nháp đầu tiên cho bài journal paper.

Tại conference, nội dung của poster hoặc slide sẽ dựa trên bản journal paper mà không phải conference paper nữa. Dựa trên phản hồi của khán giả, chúng tôi sẽ sửa đổi journal paper thêm một lần nữa trước khi nộp.

2.3. Giai đoạn 3: Nộp và sửa journal paper

Có một điểm tôi muốn đề cập là bản nộp lần đầu tiên thường không được vượt quá một số lượng trang nào đó. Ví dụ là 12 đối với bài IEEE Transactions on Image Processing (TIP) tôi nộp gần đây. Ở lần đầu, các reviewers không muốn tác giả viết quá nhiều. Làm sao gói gọn trong 12 trang là được. Sau lần đầu thì giới hạn là 16 trang.

Thêm một điểm nữa, các reviewers thường không bao giờ hài lòng ở lần review đầu tiên. Bao giờ họ cũng yêu cầu mình làm thêm experiment này nọ, giải thích rõ hơn về ý tưởng và thêm một vài chứng minh khác. Ở bản cuối cùng, nhà xuất bản cũng mong mình viết nhiều để họ còn thu thêm tiền quá trang, vì chỉ 10 trang đầu tiên là miễn phí. Mỗi trang sau trang thứ 10 sẽ bị tính thêm $200-$300 nữa.

Thế đấy, viết bài đã không được nhuận bút mà còn phải trả thêm để được xuất bản. Và nghèo thì không làm khoa học được.

Dựa trên quan sát này, ở lần nộp thứ nhất, chúng tôi thường để lại một vài thí nghiệm mà biết chắc reviewers sẽ hỏi. Sau vòng thứ nhất, hy vọng chưa bị reject, chúng tôi sẽ thêm những ý kia vào sau.

Có một điều tôi hay thấy là có những reviewers không thực sự hiểu ý tưởng của mình vì có thể họ không quen với lĩnh vực đó. Họ hay có những nhận xét chung chung kiểu như: A, bài này không khác bài conference là mấy; Với tập training nhỏ hơn thì kết quả thế nào; khi tham số mô hình thay đổi thì kết quả có tốt không; độ phức tạp của thuật toán là ntn. Những bình luận như thế này thường rất dễ trả lời :).

Khi phản hổi lại bình luận của reviewers, chúng tôi phải trả lời TỪNG Ý một. Phải thêm bớt vào bài báo sao cho mỗi reviewer đều cảm thấy các thắc mắc của mình đề đã được giải đáp triệt để. Nếu bạn làm họ hài lòng, thường ở lần thứ hai họ sẽ chấp nhận bài báo, vì cũng không muốn mất thêm thời gian vào việc review bài này nữa :).

Thi thoảng có những bình luận không được xác đáng, thầy tôi sẽ là người trực tiếp viết phản hồi. Tôi vẫn thường nhớ câu của thầy: We politely but strongly disagree with the reviewer that blah blah . Đọc câu này, các reviewer thường chột dạ, cũng sợ là mình nói gì đó sai sai, nên lần tới không dám nói bậy nữa. Tất nhiên, phải ở một trình độ rất cao mới dám viết một câu như thế này.

2.4. Thời hạn cho mỗi vòng bình luận/phản hồi:

Ở lần nộp đầu tiên, các reviewers thường được nhắc là có 6 tuần để gửi bình luận. Nhưng thường là các bác để lâu, có khi tới 5-6 tháng. Với reviewers, họ có quyền sinh sát nên chẳng quan tâm việc quá deadline. AE cũng phải ‘nhờ’ họ làm mà. Khi làm reviewer, tôi thường luôn làm đúng hẹn. Vì thường chỉ mất vài tiếng để hoàn thành, làm xong thì mình bớt đi 1 mục ở to-do list.

Nếu tới 5-6 tháng mà vẫn chưa có phản hồi, chúng tôi thường gửi một email ngắn nhắc nhở lịch sự tới AE. Thường thì sau khi nhắc, các AE sẽ thúc reviewers làm việc luôn và vài ngày sau sẽ có kết quả.

Sau khi có kết quả vòng 1 mà vẫn chưa bị Reject, chúng tôi có 6 tuần để trả lời tất cả các thắc mắc và nộp lại. Chúng tôi phải nộp 2 bản: 1 bản là bản sửa của bài báo, 1 bản là bản phản hồi tới các reviewers. Tốt nhất là làm xong trong 6 tuần, đừng có để lâu như các reviewers, chúng ta không có quyền đó. Nếu cảm thấy làm không kịp thì xin AE thêm extension. Tôi chưa xin bao giờ.

Chú ý rằng phải viết thế nào để không làm phật lòng các reviewer và cho họ thấy rằng mình đã rất nỗ lực sửa bài báo theo ý của họ. Chú ý highlight những phần thay đổi so với vòng một để reviewers không mất thời gian đọc lại những phần cũ nữa. Hai bài journal papers tôi từng viết đều được chấp nhận ở vòng thứ hai này.

Ở lần review thứ hai, các reviewers có 3 tuần để phản hồi vì họ đã quen với nội dung rồi. Và họ đôi khi cũng hay trì hoãn để tới vài tháng. May mắn cho tôi là bài đầu tiên tôi nhận kết quả Chấp nhận sau 3 tuần; bài thứ hai là sau 2 tháng, không tệ lắm.

2.5. Một vài điểm khác

Tôi có vài nguyên tắc khi trình bày bài viết:

  • Các hình vẽ là vũ khí quan trọng nhất. Tiếng Anh của mình không tốt nên nếu vẽ hình tốt để mô tả được ý tưởng thì reviewers sẽ rất thích. Về một vài tiêu chuẩn khi vẽ hình, các bạn có thể xem trong video của tôi dưới đây (giọng của tôi bên ngoài khác trong video rất nhiều)
Lưu ý khi vẽ hình cho văn bản khoa học
  • Lời lẽ trong các bài phản hồi phải thật lịch sự. Phải luôn tránh làm reviewer bực bội vì họ nắm trong tay vận mệnh bài báo của mình :D. Một điểm lưu ý nữa là hình thức của bài phản hồi cũng cần được chau chuốt.

  • Các tài liệu nên được viết bằng LaTex vì nó hỗ trợ các công thức cũng như việc trích dẫn chéo rất tốt, và rất khoa học. Đã lâu rồi tôi không dùng các sản phẩm Microsoft Office để soạn thảo, chỉ dùng để đọc các tài liệu khác. (Tôi hơi bị định kiến với các sản phẩm của Microsoft, thường nặng và đắt).

  • Cố gắng publish mã nguồn nếu có thể. Việc có mã nguồn sẽ khiến các reviewers ‘tin tưởng’ vào bài của mình hơn.

  • Làm Literature review thật kỹ trước khi viết bài. Tránh trường hợp có một bài báo khác có ý tưởng gần giống với bài của mình và đã được xuất bản từ trước.

Việc nộp bài vào một tạp chí và nhận phản hồi là miễn phí cho tới khi bài báo được Chấp nhận. Lợi dụng việc này, nhiều tác giả bắt đầu bằng việc nộp bài vào các tạp chí có thứ hạng cao hơn chất lượng của bài để nhận phản hồi; sau đó nếu bị Từ chối thì họ cũng đã có một bản tốt hơn với rất nhiều góp ý miễn phí và chất lượng. Sau đó đem bản này nộp tới tạp chí có thứ hạng thấp hơn.

Tôi thực sự phản đối cách làm này. Tôi cho rằng các tác giả làm như thế là thiếu tôn trọng các reviewers và thiếu tôn trọng chính mình. Một mặt, nó lấy đi thời gian của rất nhiều người, bao gồm AE, các reviewers, các nhân viên trong tạp chí, và cũng trì hoãn việc được Chấp nhận của chính bài báo đó. Một mặt khác, khi nộp một bài chất lượng thấp vào một tạp chí lớn, giáo sư đứng kèm tên cho bài báo đó sẽ bị đồng nghiệp (AR và các reviewers) đánh giá thấp hơn. Thi thoảng tôi có gặp một vài bài ở các nhóm nghiên cứu có giáo sư nổi tiếng nhưng chất lượng rất tệ, có thể vì giáo sư đó bận nên không đọc kỹ bài. Giáo sư của tôi rất cẩn thận, ông đọc và trực tiếp sửa trên Latex cho tất cả các bài. Vì dù sao ông cũng là người đứng tên và tài trợ trung gian cho dự án.

Một bài viết chưa thể nói hết ý về những công việc chúng tôi phải làm thường xuyên. Tôi cũng không gọi đây là bài chia sẻ kinh nghiệm mà chỉ là kể lại những gì chúng tôi gặp phải trong quá trình viết bài báo khoa học.

Hy vọng rằng bài viết có ích cho các bạn.

Thân mến,

Tiệp Vũ


Nếu có câu hỏi, Bạn có thể để lại comment bên dưới hoặc trên Forum để nhận được câu trả lời sớm hơn.
Bạn đọc có thể ủng hộ blog qua 'Buy me a cofee' ở góc trên bên trái của blog.
Tôi đang trong quá trình viết cuốn sách 'Machine Learning cơ bản I', các bạn có thể đặt trước tại đây. Cảm ơn bạn.