Cơ bản
Giao ngay
Giao dịch tiền điện tử một cách tự do
Giao dịch ký quỹ
Tăng lợi nhuận của bạn với đòn bẩy
Chuyển đổi và Đầu tư định kỳ
0 Fees
Giao dịch bất kể khối lượng không mất phí không trượt giá
ETF
Sản phẩm ETF có thuộc tính đòn bẩy giao dịch giao ngay không cần vay không cháy tải khoản
Giao dịch trước giờ mở cửa
Giao dịch token mới trước niêm yết
Futures
Truy cập hàng trăm hợp đồng vĩnh cửu
TradFi
Vàng
Một nền tảng cho tài sản truyền thống
Quyền chọn
Hot
Giao dịch với các quyền chọn kiểu Châu Âu
Tài khoản hợp nhất
Tối đa hóa hiệu quả sử dụng vốn của bạn
Giao dịch demo
Giới thiệu về Giao dịch hợp đồng tương lai
Nắm vững kỹ năng giao dịch hợp đồng từ đầu
Sự kiện tương lai
Tham gia sự kiện để nhận phần thưởng
Giao dịch demo
Sử dụng tiền ảo để trải nghiệm giao dịch không rủi ro
Launch
CandyDrop
Sưu tập kẹo để kiếm airdrop
Launchpool
Thế chấp nhanh, kiếm token mới tiềm năng
HODLer Airdrop
Nắm giữ GT và nhận được airdrop lớn miễn phí
Launchpad
Đăng ký sớm dự án token lớn tiếp theo
Điểm Alpha
Giao dịch trên chuỗi và nhận airdrop
Điểm Futures
Kiếm điểm futures và nhận phần thưởng airdrop
Đầu tư
Simple Earn
Kiếm lãi từ các token nhàn rỗi
Đầu tư tự động
Đầu tư tự động một cách thường xuyên.
Sản phẩm tiền kép
Kiếm lợi nhuận từ biến động thị trường
Soft Staking
Kiếm phần thưởng với staking linh hoạt
Vay Crypto
0 Fees
Thế chấp một loại tiền điện tử để vay một loại khác
Trung tâm cho vay
Trung tâm cho vay một cửa
Quy trình lựa chọn ETF và các điểm chính cốt lõi
Lấy danh sách ETF: Sử dụng get_all_securities([‘etf’]) để lấy toàn bộ thị trường ETF, lọc các ETF thành lập trước ngày 1 tháng 1 năm 2013 (start_date < 2013-01-01), đảm bảo dữ liệu lịch sử đầy đủ.
Loại bỏ ETF thanh khoản thấp: Thủ công loại bỏ các ETF có trung bình giá trị giao dịch quá thấp (ví dụ như 159003.XSHE Chiao Xin Fast Line ETF, 159005.XSHE Huitianfu Kuaiqian ETF, v.v.), với trung bình giá trị giao dịch ≤ 2.92kw.
Hai, Dữ liệu giá ngày và tính lợi nhuận Phạm vi dữ liệu: Lấy dữ liệu giá đóng cửa của 240 ngày giao dịch trước ngày hiện tại (today).
Xử lý lợi nhuận: Tính lợi nhuận hàng ngày (pchg = close.pct_change()), tạo ma trận lợi nhuận ETF (prices, hàng = ngày giao dịch, cột = mã ETF).
Ba, Phân cụm K-Means loại bỏ trùng lặp (dựa trên độ tương đồng xu hướng) Mục tiêu phân cụm: Gom các ETF có xu hướng tương tự thành một nhóm, giảm trùng lặp các mã mục tiêu.
Thông số: Số lượng cụm n_clusters=30 (tránh quá ít nhóm gây nhầm lẫn các ETF không tương tự), sử dụng thuật toán KMeans, seed ngẫu nhiên random_state=42.
Lọc trong nhóm: Mỗi nhóm giữ lại ETF có ngày thành lập sớm nhất, lý do:
Bốn, Đánh giá hiệu quả phân cụm bằng hệ số silhouette Tính hệ số silhouette của phân cụm: 0.4511880967361387 (trung bình, cho thấy độ chặt trong nhóm và phân tách giữa các nhóm khá tốt, cần tối ưu thêm).
Năm, Lọc hai lần dựa trên hệ số tương quan (giảm thiểu tương quan) Ma trận hệ số tương quan: Tính hệ số tương quan của lợi nhuận ETF (corr = prices[df.code].corr()).
Xử lý các cặp ETF có hệ số tương quan cao: Chỉ giữ lại các cặp có hệ số > 0.85, trong mỗi cặp chỉ giữ lại ETF thành lập sớm hơn, loại bỏ các ETF còn lại (ví dụ như loại 159922.XSHE, 512100.XSHG, v.v.).
Sáu, Tùy chọn: Lọc các ETF thành lập muộn hơn (nâng cao chất lượng dữ liệu) Đặt ngưỡng: Loại bỏ các ETF thành lập sau năm 2020 (ví dụ như 513060.XSHG Háng Sen Y tế, 515790.XSHG ETF quang điện, v.v.), đảm bảo các ETF còn lại có dữ liệu lịch sử phong phú hơn (phù hợp cho huấn luyện mô hình).
Bảy, Các chú ý và đề xuất bổ sung Xử lý đặc biệt ETF trái phiếu chính phủ: Nếu dùng để huấn luyện mô hình, cần loại bỏ 511010.XSHE ETF trái phiếu chính phủ — xu hướng gần như thẳng (tương tự như Balance Treasure), biến động cực nhỏ, gây nhiễu cho việc học đặc trưng biến động của mô hình, và không cần dự đoán.
Lựa chọn ETF giảm giá: Kết quả có thể chứa các ETF giảm giá dài hạn (như ETF y tế, ETF bất động sản), việc loại bỏ hay không phụ thuộc vào mục tiêu chiến lược:
Xác nhận bằng trực quan: Vẽ biểu đồ xu hướng của các ETF còn lại (ví dụ như giá đóng cửa từ năm 2017 trở đi), kiểm tra thủ công xem hệ số tương quan có phù hợp với kỳ vọng không (ít tương quan, phân bố hợp lý).
Tổng kết quy trình lọc cuối cùng:
Thông qua bốn bước “lọc ban đầu → phân cụm loại bỏ trùng lặp → lọc hệ số tương quan hai lần → (tùy chọn) lọc theo thời gian thành lập”, tạo ra danh mục ETF có thanh khoản tốt, xu hướng ít tương quan, dữ liệu lịch sử phong phú, nhằm cung cấp các mã mục tiêu đa dạng, chất lượng cao cho chiến lược hoặc mô hình.