Hướng dẫn sử dụng ersXP tách hard sub ra sub rời srt

Thảo luận trong 'Phụ đề' bắt đầu bởi 5ti, 6/9/19.

  1. 5ti

    5ti Uploader

    Tham gia ngày:
    7/7/08
    Bài viết:
    1,460
    Đã được cảm ơn:
    13,464
    Hiện nay có rất nhiều phim hay nhưng do người biên dịch rất bất bình về những trang web thu phí lấy sub của họ, xóa luôn cả thông tin của dịch giả rồi đăng lên thu tiền, do vậy họ gắn cứng sub vào phim rồi mới chia sẻ. Ngoài ra còn các phim thu trên Tivi có phụ đề mà bên ngoài không có
    Đặc điểm của các phim DL về thường chất lượng thấp và các sub này không tùy chỉnh được chiều cao chữ khi xem trên các kích thước màn hình khác nhau đặc biệt trên các màn hình lớn chữ bị rất to, do vậy nhu cầu có sub rời để xem với các bản phim Bluray là rất cần thiết.

    Trong bài này tôi làm hướng dẫn, chia sẻ với các bạn phương pháp tách các sub gắn cứng trong phim ra sub rời dạng ass hoặc srt, với mong muốn sẽ có nhiều người tham gia thực hiện, chia sẻ vô tư cho cộng đồng mê phim chất lượng cao.

    Qui trình này cũng có thể áp dụng cho với những phim chỉ có hardsub tiếng anh cho các dịch giả cần sub rời để biên dịch

    Tôi làm công việc này với tinh thần chia sẻ vô tư không vụ lợi nên mong các dịch giả thông cảm. Với các bạn khi làm công việc tách sub này, nên ghi thêm nguồn gốc và các thông tin của dịch giả vào sub để ghi nhận công lao cùa người biên dịch.


    Các phần mềm cần chuẩn bị:
    - ersXP : dowmload tại đây https://www.videohelp.com/software/esrXP
    - Photoshop
    - Subpro của bạn wizard trên diễn đàn này

    Dưới đây là hướng dẫn tách sub của phim KHÔNG THIẾU 1 EM ; phim của đạo diễn Trương Nghệ Mưu download từ diễn đàn www.phimconggiao.com

    1. Do chương trình này chạy với phim quá dài hay bị treo máy nên tùy theo phim các nhiều hay ít lời thoại mà các bạn phài chia phim thành các đoạn có chiều dài 20-30 phút

    02.jpg


    2. Ở đây tôi cắt ra dược 4 file mỗi file dài 25 phút, file cuối dài 30 phút
    Sau khi chia phim xong các bạn nên cho các file video vừa cắt vào các thư mục riêng biệt 1,2,...để chứa các file của từng phần trong quá trình thao tác cho đỡ nhầm lẫn

    03.jpg

    3. Mở chương trình esrXP ra vào file , open video… hoặc nhấp vào biểu tượng hình video dưới menu

    04.jpg

    4. Chọn file video cần load, ở đây tôi mở file thứ 4 trong thư mục 4

    5. Màn hình vẫn trắng tinh không có gì, các bạn đừng lo vào tiếp menu subtitle chọn filter

    04.jpg

    6. Trong màn hình filter bạn thấy video đã hiện lên, các bạn kéo con trỏ dưới cùng đến đoạn có phụ đề, nhấp vào 2 điểm trên màn hình để chọn vùng chứa phụ đề ( vùng có màu màu xám nhạt). Sau đó chỉnh các thông số trên Region để tinh chỉnh cho vùng chọn vừa khit đừng lớn quá

    07.jpg

    7. Nhấp vào ô vuông cạnh Subtitle color để chọn màu của sub: ở đây tôi chọn màu vàng

    8. Nếu sub có đường viền bao , nhấp vào ô vuông cạnh ouline color để chọn màu của dương biên sub: ở đây tôi chọn màu blue xẫm

    9. Tich các dấu chọn Enable Filter và Additional color, ô bên dưới chọn color + Outline (nếu sub có đường viền bao)

    10. Sau thao tác này vùng chọn sub sẽ bị phủ toàn bộ màu xanh hoặc đỏ không nhìn thấy sub đâu, các bạn đừng lo nhấp vào nút Advance để vào Filter Seting

    11. Chỉnh các thông số Filter Seting để hiện ra sub

    Việc chỉnh các thông số tùy theo từng phim thông thường tôi chỉ chỉnh Hue Difference và RGB Difference ở tab Outline và Final

    Việc chỉnh các thông số trong Filter Seting rất quan trọng. Các bạn cần chỉnh sao cho các chữ hiện ra đầy đủ, sắc nét và các nhiễu màu trắng hiện ra là tối thiểu để đỡ mất công xử lý sau này.
    Kinh nghiệm: Các bạn nên ưu tiên việc chọn chữ và dấu hiện ra đầy đủ và sắc nét hơn là việc giảm nhiễu, việc xóa nhiễu sẽ nhanh hơn là việc sửa chính tả sau này

    09.jpg

    12. Kéo thêm 1 số đoạm phim để kiểm tra

    10.jpg

    13. Sao khi kiểm tra xong nhấp vào ô X đỏ phía trên cùng bên phải thoát ra chở về màn hình chính. Màn hình vẫn trắng tinh,

    14. nhấp vào nút start, chương trình bắt đầu hoạt động các sub bắt đầu dược load , nút start chuyển thành stop, quá trình xử lý mất khoảng 5-10 phút

    14.jpg


    15. Vào menu file, save as lưu file có phần mở rộng esr lưu lại toàn bộ các công tác vừa thực hiện. Đây là thao tác rất quan trọng vì sau này nếu có trục trặc gì bạn chỉ cần mở lại file này chứ không phải thực hiện từ đầu

    17.jpg
     
    Chỉnh sửa cuối: 7/9/19
  2. 5ti

    5ti Uploader

    Tham gia ngày:
    7/7/08
    Bài viết:
    1,460
    Đã được cảm ơn:
    13,464
    16. Trở lại màn hình chính vào subtitle, manger

    18.jpg

    17. Zoon nhỏ lại, Chọn các ô không có chữ xóa đi
    Kinh nghiệm: Có nhiều ô cần xóa liền nhau, các bạn ko phải nhấp vào từng ô mà nhấp chột phải vào ô đầu và nhấp chuột trái vào ô cuối là chọn luôn được 1 mảng các ô cần xóa.

    20.jpg

    18. Zoom to lên kiểm tra. Dùng công cụ màu vàng để xóa các nhiễu trắng
    Kinh nghiệm : tôi không dùng công cụ xóa nhiễu ở bước này mà dùng phtoshop nhanh hơn

    22.jpg


    19 Dùng công cụ T màu xanh để bổ xung các chữ hay dấu bị thiếu (lưu ý khi dùng công cụ bổ xung chữ hay dấu bị thiếu phải tích vào ô additional Color)
    Phim này chắc chỉnh filter chưa tốt nên các dấu bị thiếu mất nhiều quá, có thể chỉnh filter lại hoặc bỏ qua và dùng tính năng replace và sửa thủ công trong notepad sau này

    23.jpg

    20. Thoát ra Quay về màn hình chính, vào menu Save OCR Image vào thư mục 4 chứa phim

    25.jpg

    21. Nên để thông số như hình sau

    27.jpg

    22. Ta được 1 số file bmp trong thư mục 4

    23. Dùng Photoshop mở các file này lên nhấn phim M và nhấp shift để chọn các vùng nhiễu sau đó Ctrl+ backspace xóa các nhiễu
    Bước này rất quan trọng các bạn chịu khó làm tỉ mỉ chút không về sau cover ra text sẽ bị lỗi sửa rất mệt

    30.jpg

    24. Dùng công cụ B để xóa các nhiễu sát các chữ

    31.jpg

    25. Xong công việc lưu file bmp lại
     
    Chỉnh sửa cuối: 6/9/19
  3. 5ti

    5ti Uploader

    Tham gia ngày:
    7/7/08
    Bài viết:
    1,460
    Đã được cảm ơn:
    13,464
    26. Các bạn vào trang web chuyển mã trực tuyến https://www.newocr.com/

    27. Mở các file bmp vừa xong và chuyển mã và copy nối tiếp vào notepad dưới dạng unicode

    37.jpg

    28. Trong notepad xóa các dòng trống

    40.jpg

    29. Dùng tính năng Replay sửa các lỗi chính tả mang tính hệ thống

    45.jpg

    30. Có 1 số dòng chuyển bị lỗi thì cứ để nguyên

    47.jpg

    31. Save kết quả

    32. Mở lại ersXP và mở file ers đã lưu bước trước

    33. Mở file notepad ở bước trước Chon toàn bộ text ctrl + X và dùng Unikey chuyển mã sang Windows CP 1258

    49.jpg

    34. Dán lại vào notepad và save as theo định dạng ANSI

    50.jpg

    35.Copy toàn bộ text dán vào cửa sổ bên trái của esrXP

    51.jpg

    36.Chỉnh text bên trái trùng với ảnh bên phải. Lưu ý mỗi dòng bên trái tương ứng với 1 ảnh bên phải, do vậy với các ảnh có 2 dòng phải chuyển text lên và ngăn cách bằng dấu “|”

    51a.jpg

    37. Kết hợp sửa chính tả cho đến hết

    38. Sau khi căn chỉnh xong save file dưới dạng srt để sử dụng và save dưới dạng esr để lưu lại quá trình thực hiện nếu cần này mai sửa tiếp

    39. Dùng subPro mở file srt vừa xong, correcting các lỗi chính tả và save lại để các dấu “|” chuyển text xuống hàng

    40. Ta được file sub hoàn chỉnh của 1 phần

    41. Làm tương tự với các file video còn lại đươc các file sub rời sau đó nối lại căn cứ theo thời gian video các bạn cắt

    42. Hưởng thụ thành quả. Trong đoạn phim chữ màu vàng là sub gắn cứng còn sub màu trắng bên dưới là sub mới hoàn thành

    59.jpg
     
    Chỉnh sửa cuối: 6/9/19
    emiuanh, minhjp, tuankbas and 5 others like this.
  4. hoaitrung

    hoaitrung Super Moderators Thành viên BQT

    Tham gia ngày:
    13/12/09
    Bài viết:
    5,667
    Đã được cảm ơn:
    304,846
    Giới tính:
    Nam
    Cảm ơn bài hướng tận tình chi tiết của bạn. Cho mình hỏi thăm một chút, là bằng phương pháp này sẽ mất khoảng bao lâu để tạo ra một phụ đề Việt hoàn chỉnh từ 1 phim điện ảnh thông thường? Với thời lượng khoảng 90 phút, phụ đề khoảng 1500 dòng.
     
    Chỉnh sửa cuối: 7/9/19
    tonthatduc and 5ti like this.
  5. 5ti

    5ti Uploader

    Tham gia ngày:
    7/7/08
    Bài viết:
    1,460
    Đã được cảm ơn:
    13,464
    Mất khoảng 3-4 h tùy theo chất lượng text trong phim bạn à.
    Thực chất thời gian có thể ngắn hơn khi bạn làm gối đầu các phần: trong thời gian chờ load phụ đề phần sau thì bạn có thể làm các công đoạn của phần trước như: khử nhiễu, chuyển mã, sửa chính tả....
     
  6. tonthatduc

    tonthatduc Well-Known Member

    Tham gia ngày:
    19/7/12
    Bài viết:
    253
    Đã được cảm ơn:
    2,274
    Trước tôi hay dùng cách trong bài "OCR hardsub thành softsub" của Mod hoaitrung để OCR hardsub tiếng Anh. Tuy nhiên phần mềm VideoSubFinder hay bỏ sót các dòng phụ đề và cũng chỉ nhận dạng được tiếng Anh, với tiếng Việt thì thua luôn.

    Nay đọc được bài viết đầy tâm huyết của bác 5ti, xin phép múa rìu qua mắt 2 thợ, tôi bổ sung thêm một phương pháp kết hợp cách của cả 2 cao thủ. Cách này dùng esrXP để chuyển phụ đề thành ảnh dạng *.bmp và dùng ABBYY FineReader để nhận dạng và chuyển file ảnh thành ký tự.

    Phần mềm esrXP nhận dạng không sót dòng hardsub nào, đây là ưu điểm lớn so với VideoSubFinder. Còn phần mềm ABBYY FineReader OCR các file ảnh và chuyển thành văn bản tiếng Việt khá tốt.

    Phần mềm esrXP và ABBYY FineReader (tôi dùng bản 11) chạy tốt trên Win 7 32 bit, tôi chưa có điều kiện thử trên các phiên bản khác. Do tôi mới dùng các phần mềm này để OCR cho 1 phim nên kinh nghiệm chưa nhiều, các cách cài đặt có thể chưa tối ưu, mong các bạn bổ sung giúp nếu có thể.

    1-Chuẩn bị phần mềm:
    -UniKey 4.2 RC4 32 bit hoặc 64 bit tùy phiên bản Windows của các bạn
    -ABBYY FineReader
    -K-Lite Codec Pack bản mới nhất (trong trường hợp phần mềm esrXP không chạy, nếu chạy được thì không cần). Tuy nhiên, vẫn có những file không chạy được thì các bạn hãy thử convert video thành avi xem sao.
    Các phần mềm trên đều có sẵn trên internet, các bạn tự tìm và cài đặt.

    2-Cài đặt esrXP
    Lưu ý: nhớ chạy esrXP và Unikey bằng chế độ Admin (bấm chuột phải vào file *.exe, chọn Run as Administrator)
    - Vào menu Option-Select font chọn font Unicode như hình dưới, ở đây mình chọn Tahoma, lưu ý script là “Vietnamese”:
    [​IMG]
    -Vào menu Subtitle, chọn Subtitle Style, chọn font Tahoma, script là “Vietnamese”. Xong rồi chọn “Use Unicode output”
    [​IMG]
     
  7. tonthatduc

    tonthatduc Well-Known Member

    Tham gia ngày:
    19/7/12
    Bài viết:
    253
    Đã được cảm ơn:
    2,274
    3-Thực hiện
    Các bước từ 1 đến 6:
    theo hướng dẫn của bác 5ti.
    Bước 7: chọn màu phụ đề và màu viền
    Đây là bước rất quan trọng để phần mềm nhận dạng được phụ đề nên tôi sẽ chi tiết thêm, cụ thể:
    Chọn màu phụ đề:
    -Đưa trỏ chuột vào vùng chữ phụ đề, bạn nhìn vùng số 1 trong hình dưới sẽ có mã màu, ghi mã đó lại, ví dụ như ở đây là R254 G254 B252
    [​IMG]
    -Bấm vào subtitle color như vùng số 2 trong ảnh, nhập giá trị R (red), G (green) và B (blue) như trên rồi chọn "Add custom colors"
    -Tại "Custom color", bấm vào ô màu vừa được thêm vào (vùng trong khoanh tròn đỏ), rồi bấm OK
    [​IMG]
    Chọn màu viền phụ đề: Làm như chọn màu phụ đề.

    Bước 8-20: Làm như bác 5ti hướng dẫn
    Bác 5ti đã có kinh nghiệm, nhờ bác hướng dẫn thêm mục Chỉnh các thông số Filter Seting

    Bước 21:
    Đặt thông số như ảnh dưới
    [​IMG]
    Sẽ có các tác dụng sau:
    -Scale Subtitle Image: chỉnh lên 2 để ABBYY FineReader có thể nhận dạng được
    -Divid each subtitle in to 2 lines: Các dòng dạng như ảnh dưới sẽ tự dồn vào trong 1 dòng, lúc đó chỉ cần chèn thêm ký tự “|” (ký tự này nằm ngay dưới phím "←", hoặc cạnh phím Enter) vào giữa 2 khoảng ngắt dòng là xong
    [​IMG]

    Bước 22-25: Làm như bác 5ti hướng dẫn

    Bước 26-34: Dùng ABBYY FineReader để nhận dạng và chuyển mã
    -Lưu ý chọn Vietnamese cho tiếng Việt và English cho tiếng Anh. Chọn Open, chọn tất các ảnh, dùng phần mềm này chỉ cần mấy phút là xong, không cần chuyển mã online. Xem hình minh họa trên phiên bản 11
    [​IMG]
    -Lưu file như hình, lưu ý file option là: “Creat a single file for all pages”
    [​IMG]
    Xong bước này, ta có 1 file txt chứa nội dung phụ đề.

    Bước 35: Lấy kết quả ở file txt trên, dán vào bên trái của esrXP, không cần chuyển mã file txt sang Vietnamese Local CP 1258.

    Bước 36-38: Làm theo hướng dẫn của bác 5ti

    Bước 39: Gõ tiếng Việt trong khung soạn thảo bên trái
    Bước này không cần dùng Subpro mà sửa lỗi chính tả, chỉnh dòng, gõ tiếng Việt... trong esrXP luôn.
    Các bạn dùng UniKey 4.2 RC4 32 bit hay 64 bit tùy theo Windows, chọn bảng mã là “Unicode tổ hợp”, không chọn Vietnamese local CP 1258
    Dùng cách này sẽ tiện hơn của bác 5ti, vừa gõ bên trái vừa đối chiếu với ảnh sub bên phải, nhanh hơn dùng Subpro
    [​IMG]
    Lưu ý, khi làm chưa xong trên esrXP, nếu bạn chọn menu File-Save thì chỉ lưu file esr chứ không lưu file text ở khung bên trái. Nên dùng File-Save As, ở “Save as type” lưu lần lượt cả 2 dạng “esrXP” và Sub Rip (*.srt).

    Bước 40-42: Làm theo hướng dẫn của bác 5ti và thưởng thức thành quả.

    Tôi vừa học vừa làm theo hướng dẫn nên mất 1,5 ngày cho OCR phim đầu tay và đã có kết quả ở đây. Có lẽ phải thực hiện vài phim rồi mới rút ngắn thời gian xuống còn 3-4h như bác 5ti được.
    Với các bạn không đủ kiên nhẫn, đây không phải phép màu. Đừng hy vọng cho máy chạy 3-4h rồi có kết quả để thưởng thức ngay được đâu, còn phải chỉnh sửa nhiều. Nhưng dù sao tôi vẫn mong có thêm người tham gia để có thêm nhiều phụ đề Việt cho cộng đồng.
    Cảm ơn 2 bác 5ti và hoaitrung!
     
    trwng_tamphong, hoaitrung and 5ti like this.
  8. 5ti

    5ti Uploader

    Tham gia ngày:
    7/7/08
    Bài viết:
    1,460
    Đã được cảm ơn:
    13,464
    Cám ơn bạn tonthatduc đã nhiệt tình bổ sung hoàn thiện cho phương pháp. Đặc biệt là dùng ABBYY FineReader để cover từ ảnh sang text. Trước đây tôi cũng đã dùng mấy phiên bản cũ , do việc chuyển rất trục trặc nên ko dùng nữa. Bây giờ cài bản ABBYY FineReader 14 chạy rất chuẩn, tốt hơn hẳn chuyển online.
    Việc chuyển sub đúng nhưng bạn nói, làm công việc này phải hết sức kiên nhẫn. Thực tế để hoàn chỉnh 1 phụ đề cũng tốn rất nhiều thời gian. Thời gian 3-4 giờ tôi làm, đúng là mới ra sub về cơ bản là sử dụng được cho người dễ tính. Thực tế việc chỉnh lý hết các lỗi chính tả về sau phải làm dần dần nhiều lần và cuối cùng phải ngồi xem cả phim mới chỉnh lý hết được.

    Bổ xung thêm 1 số kinh nghiệm:

    1. Phần mềm ersXP hoạt động tốt nhất với phim có độ phân giải 720p trở lên. Với các phim có độ phân giải thấp quá, các bạn nên cover lên 720p ( việc này rất hiệu quả đấy)

    2. Với phim 720p đến công đoạn save OCR tôi không scale subtile image sang 2 mà để 1 và tôi ko chọn Divid each subtitle in to 2 lines vì chương trình chuyển hay bị nhầm lẫn thứ tự các dòng (hay là do qui trình tôi làm chưa chuẩn chăng…) và chọn 50 - 70 dòng 1 ảnh

    3. Đối với các bạn thành thạo photoshop và có bàn vẽ Wacom nên sử lý việc xóa nhiễu trên photoshop. Tôi thậm chí còn dùng bút wacom sửa lỗi chính tả trên photoshop rất nhanh.

    Rất mong các bạn cho thêm các ý kiến đóng góp để hoàn thiện phương pháp
     
    Chỉnh sửa cuối: 30/12/19
  9. hoaitrung

    hoaitrung Super Moderators Thành viên BQT

    Tham gia ngày:
    13/12/09
    Bài viết:
    5,667
    Đã được cảm ơn:
    304,846
    Giới tính:
    Nam
    tonthatduc and 5ti like this.
  10. 5ti

    5ti Uploader

    Tham gia ngày:
    7/7/08
    Bài viết:
    1,460
    Đã được cảm ơn:
    13,464
    Việc chỉnh các thông số đúng là rất quan trọng, sẽ quyết định thời gian thực hiện nhanh hay chậm. Ví dụ như phim bạn làm vừa rồi mất 1.5 ngày thì lâu quá. Có lẽ công đoạn bạn chỉnh Filter setting chưa tốt nên việc xóa nhiễu và sửa chính tả mất nhiều thời gian, kể cả thời gian chạy esrXP nữa.

    Mình đã lấy đúng phim của bạn và làm thử thì thấy rất nhanh vì bản phim của bạn chất lượng rất tốt.
    Thời gian bắt đầu thực hiện đến công đoạn cover ORC sang text và sửa chính tả 1 số lỗi hệ thống thì mất đúng 1h 10 phút. Do bản phim tốt text ra khá là chuẩn, lỗi chính tả rất ít, nên nếu làm các công đoạn còn lại chỉ mất khoảng 2 h nữa là xong.

    Mình gửi thông số seting và các file trong quá trình thực hiện để bạn tham khảo
    File *_01.esr : là mới chạy xong
    File *_02.esr : là đã chỉnh trong Manger để xuất ra OCR
    File *_01.txt : sau khi cover ORC sang text
    File *_02.txt : sau khi chỉnh 1 số lỗi chính tả hệ thống.

    Để tiết kiệm thời gian, Mình làm gối đầu các công đoạn. Trong khi chạy esrXP đoạn phim thứ 2 thì mình cover ORC sang text và chỉnh sửa chính tả các lỗi hệ thống đoạn phim 1 và cứ thế tiếp theo.
    Việc chỉnh sửa chính tả các lỗi hệ thống mình thực hiện ngay trong notepad. Ví dụ phim này bị rất nhiều lỗi thừa các dấu trên chữ i. Mình dùng chức năng replace chuyển í —> i; ỉ —> i; ĩ —> i. Lưu ý là phải Find next rồi xem từ nào bị lỗi thì mới Replace nhé.

    Đợt tới bạn làm phim nào có thể chuyển phim cho mình, mình sẽ chỉnh setting và làm công đoạn đầu này cho.

    File tham khảo qui trình thực hiện:
    https://www.fshare.vn/file/ZRNPCB6QUS66
     
    Chỉnh sửa cuối: 10/10/19
    hoaitrung and tonthatduc like this.
  11. hoaitrung

    hoaitrung Super Moderators Thành viên BQT

    Tham gia ngày:
    13/12/09
    Bài viết:
    5,667
    Đã được cảm ơn:
    304,846
    Giới tính:
    Nam
    Có bộ The Vietnam War (2017) này 10 tập hardsub Việt chất lượng tốt mình đang giữ (5 GB/tập). Bluray REMUX cũng đang có sẵn. Sub rời thì chắc là không thể có rồi. Các anh em có muốn đánh một quả lớn này không? Nói thiệt, mình cũng máu lắm mà không đủ sức làm nổi, lực bất tòng tâm. Phần vì cũng không quen sử dụng soft này, không dám bày ra từ đầu :D
    [​IMG]
     
    tonthatduc and 5ti like this.
  12. 5ti

    5ti Uploader

    Tham gia ngày:
    7/7/08
    Bài viết:
    1,460
    Đã được cảm ơn:
    13,464
    Việc này cũng chẳng có gì là lớn. Nếu không thạo, thì từ từ làm rồi cũng xong. Việc tách sub không khó, vấn đề là phải kiên nhẫn chút thôi. Ban đầu làm ko quen thì làm chậm, làm vài phim, tự rút kinh nghiệm là sẽ nhanh. Chả ai tự nhiên làm nhanh ngay cả.
    Bộ phim này hiện tôi đang lưu trữ bản Web 1080 DL từ trang chủ xem thấy cũng ổn. Font chữ xem trên màn hình 65 inch hơi bị to nhưng có thể chấp nhận được, do vậy cũng không có nhu cầu dùng sub rời. Tuy nhiên sáng nay ngứa tay chạy thử 1 tập, thấy làm cũng nhanh, mỗi tập mất khoảng hơn 2h, do vậy sẽ thu xếp làm tặng các bạn.
     
    1131411314, tonthatduc and hoaitrung like this.
  13. hoaitrung

    hoaitrung Super Moderators Thành viên BQT

    Tham gia ngày:
    13/12/09
    Bài viết:
    5,667
    Đã được cảm ơn:
    304,846
    Giới tính:
    Nam
    Nhiều anh em mong muốn sub Việt rời của bộ này lắm mà không ai làm nổi. Cảm ơn bạn rất nhiều vì đã có lòng nhận lời.
     
    Chỉnh sửa cuối: 12/10/19
    tonthatduc cảm ơn bài này.
  14. 5ti

    5ti Uploader

    Tham gia ngày:
    7/7/08
    Bài viết:
    1,460
    Đã được cảm ơn:
    13,464
    Chỉnh sửa cuối: 18/10/19
    fanxian2005, tonthatduc and hoaitrung like this.
  15. tonthatduc

    tonthatduc Well-Known Member

    Tham gia ngày:
    19/7/12
    Bài viết:
    253
    Đã được cảm ơn:
    2,274
    Cuối tuần mới rảnh, tôi làm theo hướng dẫn của bác 5ti cho 1 phim khác thì chỉ còn 8h, cụ thể như sau:
    1-Phần mềm EsrXP chạy nhận dạng phụ đề mất 2h, dù phụ đề chỉ khoảng 500 dòng (tiếng Anh). Cũng có thể do laptop đã 10 năm tuổi nên cũng khó mà nhanh được.
    2-Bước Recover filtered mất khoảng 4h do chữ thiếu nét rất nhiều, có khi cả dòng không được chữ nào. Đây chắc chắn do chỉnh filter setting chưa chuẩn.
    3-Xem xét, chỉnh sửa, kiểm tra phụ đề mất khoảng 2h.
    Tôi dự kiến có thể rút ngắn bước 1 và 2 nếu chỉnh filter setting chuẩn hơn sau nhiều kinh nghiệm. Còn bước 3 thì khó có thể rút ngắn hơn do là phụ đề tiếng Anh, thời gian kiểm tra và chỉnh sửa lâu hơn tiếng Việt.

    Cảm ơn bác 5ti đã nhiệt tình nhận giúp công đoạn khó khăn nhất của nhận dạng hardsub. Tuy nhiên, tôi chủ yếu dùng để tách hardsub tiếng Anh trong phim tài liệu chứ rất ít dùng cho tiếng Việt. Phim tài liệu thông thường hay có dạng hardsub như sau:
    với số lượng không nhiều, khoảng vài chục đến hơn trăm dòng là cùng. Còn phim nào hardsub toàn bộ thì cũng chỉ 500-600 dòng mà thôi. Nên những việc này tôi xin phép tự làm để cho thạo.
    Còn về OCR phụ đề tiếng Việt, do tôi cũng là người dịch phụ đề nên cũng không muốn lấy phụ đề của người khác để đưa lên subscene cho lắm. Cho đến giờ, tôi mới chỉ đưa 2 phụ đề Việt lên mà thôi.
    Tuy nhiên, trong quá trình thực hiện những phim tiếp theo, nếu có gì vướng mắc tôi sẽ đưa lên và mong được bác giải đáp.
    Một lần nữa cảm ơn bác 5ti rất nhiều!
     
    hoaitrung and 5ti like this.
  16. spectrum_kdrew

    spectrum_kdrew Well-Known Member

    Tham gia ngày:
    12/1/15
    Bài viết:
    226
    Đã được cảm ơn:
    1,885
    Sau khi có tách được text rồi thì làm thế nào để thành sub các bác?
     
    5ti cảm ơn bài này.
  17. hoaitrung

    hoaitrung Super Moderators Thành viên BQT

    Tham gia ngày:
    13/12/09
    Bài viết:
    5,667
    Đã được cảm ơn:
    304,846
    Giới tính:
    Nam
    Lấy file text đó kéo thả vào SubPro 3.6 xong rồi save lại là bạn sẽ có 1 file srt ngon không bị lỗi gì.
    @spectrum_kdrew : mà bạn đã tách được ngon lành chưa?
     
    5ti cảm ơn bài này.
  18. spectrum_kdrew

    spectrum_kdrew Well-Known Member

    Tham gia ngày:
    12/1/15
    Bài viết:
    226
    Đã được cảm ơn:
    1,885
    E tách được sub ra rồi, đã bỏ vào subpro theo hd của bác và save srt
    Nhưng mà lấy time của sub gốc thế nào để sync cho srt vừa save kia cho khớp phim ạ?
     
    5ti cảm ơn bài này.
  19. hoaitrung

    hoaitrung Super Moderators Thành viên BQT

    Tham gia ngày:
    13/12/09
    Bài viết:
    5,667
    Đã được cảm ơn:
    304,846
    Giới tính:
    Nam
    Muốn sub gốc trước tiên bạn có thể lên subscene.com tìm các sub Eng (hoặc các ngôn ngữ khác), down về test với bản phim mà bạn muốn xem có khớp không. Nếu khớp thì lấy sub đó làm time code chuẩn, sync với sub Việt mà bạn vừa OCR được.

    Nếu tìm không có Sub trên đó thì buộc phải đi tìm các bản phim khác có sub mềm mux sẵn, tách nó ra về thử.

    Hoặc từ các đĩa Bluray hoặc file REMUX: Sub gốc thường có dạng PGS: Picture based subtitle format used on BDs/HD-DVDs. Dùng phần mềm Subtitle Edit tách nó ra bạn cũng có sub gốc.

    Nếu tách được sub Việt rồi mà sync không quen, bạn cũng có thể nhờ ae HDVN trên này phụ 1 tay, cứ post ngay cái topic phim chưa có sub Việt đó, thế nào cũng có người làm.
     
    Chỉnh sửa cuối: 17/11/19
    maihaclau9, 5ti and spectrum_kdrew like this.
  20. phan phong tan

    phan phong tan Well-Known Member

    Tham gia ngày:
    20/5/11
    Bài viết:
    571
    Đã được cảm ơn:
    589
    Giới tính:
    Nam
    Nghề nghiệp:
    Chuyên viên kinh tế
    Nơi ở:
    Việt Nam
    Xin trân trọng cảm ơn Bạn 5ti rất nhiều vì đã chia sẻ và hướng dẫn rất tuyệt vời. Rảnh rỗi chút thời gian sẽ nhào vô làm thử xem sao. Vì xin nhiều rồi, cũng phải có đóng góp vào chút xíu với ACE chứ.
     
    hoaitrung and 5ti like this.

Chia sẻ trang này