Một số mẹo đơn giản để tăng hiệu suất Java

Hầu hết các lập trình viên đều cho rằng việc optimize hiệu suất là một vấn đề phức tạp đòi hỏi nhiều kinh nghiệm và kiến thức. Tất nhiên, điều đó không phải sai, bởi optimize một ứng dụng để đạt được hiệu suất tốt nhất không phải là một nhiệm vụ dễ dàng. Nhưng điều đó không có nghĩa là bạn không thể làm bất cứ điều gì nếu bạn không có những kiến thức đó. Dưới đây là một số gợi ý và bài tập tốt nhất giúp bạn tạo ra một ứng dụng hiệu quả.

Hầu hết các mẹo này đều dành cho Java. Nhưng cũng có một số language-independent (ngôn ngữ độc lập), mà bạn có thể áp dụng cho tất cả các ứng dụng và ngôn ngữ lập trình. Chúng ta hãy nói về một số mẹo điều chỉnh hiệu suất của riêng Java.

1. Sử dụng StringBuilder để nối các String

Có rất nhiều phương thức để kết nối strings trong Java. Bạn có thể dùng những cách đơn giản như + hoặc +=, StringBuffer hoặc StringBuilder.

Vậy bạn thích cách tiếp cận nào nhất?

Câu trả lời tùy thuộc vào code bạn kết nối String. Nếu là thêm nội dung với for-loop thì bạn nên dùng StringBuilder bởi nó dễ dùng và cho hiệu năng tốt hơn StringBuffer. (Lưu ý rằng StringBuffer thì an toàn và phù hợp cho nhiều tình huống).

Bạn chỉ cần instantiate một StringBuilder và call append method để add phần mới vào String. Sau khi đã add mọi thứ thì bạn có thể call toString() method để lấy lại các String được kết nối. Code snippet sau đây cho ta thấy trong mỗi lần iteration, loop convert i thành một String và add chúng với một khoảng trống vào StringBuilder sb. Do đó, Code viết vào log file như sau: “This is a test0 1 2 3 4 5 6 7 8 9”:

Bạn có thể thấy trong code snippet, ta cung cấp yếu tố đầu tiên của String tới constructor method. Nó sẽ tạo ra StringBuilder mới chứa String được cung cấp kèm theo khoảng trống có thể thêm 16 kí tự nữa. Khi bạn add thêm kí tự vào StringBuilder, JVM sẽ ngay lập tức tăng size của StringBuilder lên rất nhiều.

Còn nếu bạn đã biết có bao nhiêu kí tự trong String, bạn có thể giới hạn số lượng khoảng trống và nhờ đó tăng hiệu năng bởi nó không cần phải tự tăng sức chứa.

2. Dùng + để kết nối String trong một Statement

Khi bạn triển khai ứng dụng đầu tiên trong Java, hẳn sẽ có ai đó nói với bạn rằng bạn không nên nối String bằng ‘+’. Và điều đó đúng nếu bạn đang nối String với application logic (các logic riêng cho một application cụ thể). Các String là không thay đổi và kết quả của mỗi String concatenation được lưu trong một String object mới. Điều đó đòi hỏi thêm memory và sẽ làm chậm ứng dụng của bạn, đặc biệt nếu bạn đang nối nhiều String trong một loop (vòng lặp).

Trong những trường hợp này, bạn nên làm theo mẹo số 5 và sử dụng một StringBuilder.

Nhưng đó không phải là lựa chọn nếu bạn đang muốn phá vỡ một String thành nhiều dòng để cải thiện tính dễ đọc của code.

Trong những trường hợp này, bạn nên nối String của mình với một ‘+’ đơn giản. Trình biên dịch Java của bạn sẽ optimize điều này và thực hiện các concatenation tại thời gian compile. Vì vậy, trong runtime, code của bạn sẽ chỉ sử dụng 1 String.

3. Sử dụng Primitives ở điểm có thể

Một cách nhanh chóng và dễ dàng để tránh chi phí phát sinh và cải thiện hiệu suất của ứng dụng là sử dụng các kiểu primitive thay vì các class wrapper của chúng. Vì vậy, tốt hơn hết là sử dụng một int thay vì một Integer, hoặc một double thay vì một Double. Điều đó cho phép JVM của bạn lưu trữ value trong stack thay vì trong heap để giảm mức độ tiêu thụ memory và xử lý tổng thể hiệu quả hơn.

4. Cố gắng tránh BigInteger và BigDecimal

Như chúng ta đã nói về các loại dữ liệu, chúng ta cũng nên xem nhanh BigInteger và BigDecimal. Đặc biệt là vì tính chính xác của nó. Nhưng cái gì cũng có giá của nó.

BigInteger và BigDecimal yêu cầu memory nhiều hơn một long hoặc double đơn giản và làm chậm tất cả các phép tính một cách đáng kể. Vì vậy, tốt hơn hãy suy nghĩ thật kỹ, nếu bạn cần tăng độ chính xác hoặc nếu number của bạn vượt quá phạm vi của một long. Đây có thể là điều duy nhất bạn cần phải thay đổi để khắc phục các vấn đề về hiệu suất, đặc biệt là nếu bạn đang thực hiện một mathematical algorithm (thuật toán về toán học).

5. Kiểm tra ở Current Log đầu tiên

Điều này là hiển nhiên, nhưng thật không may, bạn có thể thấy hiện nay có rất nhiều đoạn code bỏ qua nó. Trước khi tạo một thông báo debug, bạn nên luôn luôn kiểm tra current log trước tiên. Nếu không, bạn có thể tạo một String mà log message sẽ bị bỏ qua.

Dưới đây là hai ví dụ về cách mà bạn KHÔNG nên làm.

Trong cả hai trường hợp này, bạn sẽ thực hiện tất cả các bước cần thiết để tạo ra log message mà không cần biết liệu logging framework của bạn có sử dụng log message hay không. Tốt hơn hết là kiểm tra mức độ current log đầu tiên, trước khi bạn tạo ra các tin nhắn debug.

6. Sử dụng Apache thông thường StringUtils.Replace thay vì String.replace

Nói chung, method String.replace hoạt động tốt và hiệu quả khá cao, đặc biệt nếu bạn đang sử dụng Java 9. Nhưng nếu ứng dụng của bạn đòi hỏi nhiều hoạt động replace và bạn chưa cập nhật phiên bản Java mới nhất, thì vẫn có các lựa chọn thay thế nhanh hơn và hiệu quả hơn.

Một ứng cử viên sáng giá là method StringUtils.replace của Apache Commons Lang. Như Lukas Eder mô tả trong một trong các bài blog gần đây của họ, nó vượt trội hơn method String.replace của Java 8.

Và nó chỉ đòi hỏi ít sự thay đổi. Bạn cần phải thêm một Maven dependency  vào project Commons Lang của Apache vào application pom.xml của bạn và thay thế tất cả các lệnh call của method String.replace bằng method StringUtils.replace.

7. Lưu trữ resource lớn, như kết nối Database

Caching (bộ nhớ đệm) là một giải pháp phổ biến để tránh việc lặp lại các đoạn code “nặng” hoặc thường xuyên được sử dụng. Ý tưởng chung đơn giản là: Tái sử dụng các resources như vậy sẽ đỡ tốn kém hơn so với việc tạo ra một cái mới hơn.

Một ví dụ điển hình là lưu trữ các kết nối cơ sở dữ liệu trong một pool. Việc tạo ra một kết nối mới đòi hỏi nhiều thời gian, bạn có thể tránh được điều đó nếu bạn sử dụng lại một kết nối hiện có.

Bạn cũng có thể tìm các ví dụ khác bằng chính ngôn ngữ Java. Method valueOf của class Integer, ví dụ, lưu các value giữa -128 và 127. Bạn có thể cho rằng việc tạo ra một Integer mới không phải là quá tốn kém, nhưng nó thường sử dụng cách lưu trữ các giá trị được sử dụng nhiều nhất để đạt hiệu suất tối đa.

Nhưng khi bạn nghĩ về cache, hãy nhớ rằng việc thực hiện cache cũng tiêu tốn resource. Bạn cần phải dành thêm memory để lưu trữ các resource tái sử dụng và bạn có thể cần phải quản lý bộ nhớ cache của mình để giúp cho các resource có thể truy cập được hoặc để xóa các resource lỗi thời.

Vì vậy, trước khi bạn bắt đầu bộ nhớ cache bất kỳ resource nào, hãy đảm bảo rằng bạn sử dụng chúng thường đủ để vượt quá chi phí của việc triển khai bộ nhớ cache của bạn.

Tổng kết

Như bạn đã thấy, đôi khi không cần quá nhiều công sức để cải thiện hiệu suất ứng dụng của bạn. Hầu hết các đề xuất trong bài này chỉ cần thêm một sự cố gắng nhỏ là có thể áp dụng chúng vào code của bạn.

Nhưng như thông thường, những khuyến nghị quan trọng nhất vẫn là:

  • Không optimize trước khi bạn biết nó là cần thiết
  • Sử dụng profiler để tìm ra nút thắt thực sự
  • Xử lý nút thắt lớn nhất trước tiên

Cám ơn các bạn đã đọc bài viết này, hy vọng nó sẽ giúp ích nhiều cho bạn trong công việc.

——
STANFORD – ĐÀO TẠO VÀ PHÁT TRIỂN CÔNG NGHỆ
Hotline: 0963 723 236 – 024 6275 2212
Website: https://stanford.com.vn/

Nhận xét