first commit

2024-11-21 22:05:36 +08:00 · 2024-11-21 22:05:36 +08:00 · 9052bb9243
commit 9052bb9243
5 changed files with 238 additions and 0 deletions
--- a/src/pycache/dataset.cpython-312.pyc
+++ b/src/pycache/dataset.cpython-312.pyc
--- a/src/pycache/model.cpython-312.pyc
+++ b/src/pycache/model.cpython-312.pyc
--- a/src/dataset.py
+++ b/src/dataset.py
@ -0,0 +1,84 @@
 import os
 import torch
 from torch.utils.data import Dataset, DataLoader
 from torchvision import transforms
 from PIL import Image
 from sklearn.model_selection import train_test_split
 class ChestXrayDataset(Dataset):
    def __init__(self, file_paths, labels, transform=None):
        self.file_paths = file_paths
        self.labels = labels
        self.transform = transform
    def __len__(self):
        return len(self.file_paths)
    def __getitem__(self, idx):
        img_path = self.file_paths[idx]
        image = Image.open(img_path).convert('RGB')
        label = self.labels[idx]
        if self.transform:
            image = self.transform(image)
        return image, label
 def prepare_data(data_dir, batch_size=32):
    # 获取所有图片文件路径
    normal_dir = os.path.join(data_dir, 'normal')
    pneumonia_dir = os.path.join(data_dir, 'pneumonia')
    normal_files = [os.path.join(normal_dir, f) for f in os.listdir(normal_dir) 
                   if f.endswith(('.png', '.jpg', '.jpeg'))]
    pneumonia_files = [os.path.join(pneumonia_dir, f) for f in os.listdir(pneumonia_dir) 
                      if f.endswith(('.png', '.jpg', '.jpeg'))]
    # 合并文件路径和标签
    all_files = normal_files + pneumonia_files
    labels = [0] * len(normal_files) + [1] * len(pneumonia_files)
    # 划分训练集和测试集
    train_files, test_files, train_labels, test_labels = train_test_split(
        all_files, labels, test_size=0.2, random_state=42, stratify=labels
    )
    # 数据预处理和增强
    train_transform = transforms.Compose([
        transforms.Resize((224, 224)),
        transforms.RandomHorizontalFlip(),
        transforms.RandomRotation(10),
        transforms.RandomAffine(degrees=0, translate=(0.05, 0.05)),
        transforms.ColorJitter(brightness=0.2, contrast=0.2),
        transforms.ToTensor(),
        transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
    ])
    test_transform = transforms.Compose([
        transforms.Resize((224, 224)),
        transforms.ToTensor(),
        transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
    ])
    # 创建数据集
    train_dataset = ChestXrayDataset(train_files, train_labels, train_transform)
    test_dataset = ChestXrayDataset(test_files, test_labels, test_transform)
    # 创建数据加载器
    train_loader = DataLoader(
        train_dataset, 
        batch_size=batch_size, 
        shuffle=True, 
        num_workers=4,
        pin_memory=True
    )
    test_loader = DataLoader(
        test_dataset, 
        batch_size=batch_size, 
        shuffle=False,
        num_workers=4,
        pin_memory=True
    )
    return train_loader, test_loader
--- a/src/model.py
+++ b/src/model.py
@ -0,0 +1,67 @@
 import torch
 import torch.nn as nn
 import torch.nn.functional as F
 class MultiResRibNet(nn.Module):
    def __init__(self):
        super(MultiResRibNet, self).__init__()
        # 高分辨率路径 (224x224)
        self.high_res_path = nn.Sequential(
            nn.Conv2d(3, 32, kernel_size=3, padding=1),
            nn.BatchNorm2d(32),
            nn.ReLU(),
            nn.Conv2d(32, 64, kernel_size=3, padding=1),
            nn.BatchNorm2d(64),
            nn.ReLU(),
            nn.Conv2d(64, 128, kernel_size=3, padding=1),
            nn.BatchNorm2d(128),
            nn.ReLU()
        )
        # 低分辨率路径 (112x112)
        self.low_res_path = nn.Sequential(
            nn.Conv2d(3, 32, kernel_size=3, padding=1),
            nn.BatchNorm2d(32),
            nn.ReLU(),
            nn.Conv2d(32, 64, kernel_size=3, padding=1),
            nn.BatchNorm2d(64),
            nn.ReLU(),
            nn.Conv2d(64, 128, kernel_size=3, padding=1),
            nn.BatchNorm2d(128),
            nn.ReLU()
        )
        # 特征融合
        self.fusion = nn.Sequential(
            nn.Conv2d(256, 128, kernel_size=3, padding=1),
            nn.BatchNorm2d(128),
            nn.ReLU(),
            nn.Conv2d(128, 64, kernel_size=3, padding=1),
            nn.BatchNorm2d(64),
            nn.ReLU()
        )
        # 分类器
        self.classifier = nn.Sequential(
            nn.AdaptiveAvgPool2d((1, 1)),
            nn.Flatten(),
            nn.Linear(64, 2)
        )
    def forward(self, x):
        # 高分辨率特征
        high_res = self.high_res_path(x)
        # 低分辨率特征
        low_res_input = F.interpolate(x, scale_factor=0.5)
        low_res = self.low_res_path(low_res_input)
        low_res = F.interpolate(low_res, size=high_res.shape[2:])
        # 特征融合
        fused = torch.cat([high_res, low_res], dim=1)
        fused = self.fusion(fused)
        # 分类
        out = self.classifier(fused)
        return out
--- a/src/train.py
+++ b/src/train.py
@ -0,0 +1,87 @@
 import torch
 import torch.nn as nn
 import torch.optim as optim
 from model import MultiResRibNet
 from dataset import prepare_data
 import os
 def train(model, train_loader, test_loader, num_epochs=50):
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    model = model.to(device)
    criterion = nn.CrossEntropyLoss()
    optimizer = optim.Adam(model.parameters(), lr=0.001)
    scheduler = optim.lr_scheduler.ReduceLROnPlateau(optimizer, 'min', patience=3)
    best_acc = 0.0
    for epoch in range(num_epochs):
        # 训练阶段
        model.train()
        running_loss = 0.0
        correct = 0
        total = 0
        for inputs, labels in train_loader:
            inputs, labels = inputs.to(device), labels.to(device)
            optimizer.zero_grad()
            outputs = model(inputs)
            loss = criterion(outputs, labels)
            loss.backward()
            optimizer.step()
            running_loss += loss.item()
            _, predicted = outputs.max(1)
            total += labels.size(0)
            correct += predicted.eq(labels).sum().item()
        train_loss = running_loss / len(train_loader)
        train_acc = 100. * correct / total
        # 测试阶段
        model.eval()
        test_loss = 0.0
        correct = 0
        total = 0
        with torch.no_grad():
            for inputs, labels in test_loader:
                inputs, labels = inputs.to(device), labels.to(device)
                outputs = model(inputs)
                loss = criterion(outputs, labels)
                test_loss += loss.item()
                _, predicted = outputs.max(1)
                total += labels.size(0)
                correct += predicted.eq(labels).sum().item()
        test_loss = test_loss / len(test_loader)
        test_acc = 100. * correct / total
        scheduler.step(test_loss)
        print(f'Epoch [{epoch+1}/{num_epochs}]')
        print(f'Train Loss: {train_loss:.4f} | Train Acc: {train_acc:.2f}%')
        print(f'Test Loss: {test_loss:.4f} | Test Acc: {test_acc:.2f}%')
        # 保存最佳模型
        if test_acc > best_acc:
            best_acc = test_acc
            torch.save(model.state_dict(), 'best_model.pth')
 if __name__ == '__main__':
    # 数据路径
    data_dir = '../data/'
    # 准备数据
    train_loader, test_loader = prepare_data(data_dir, batch_size=32)
    # 创建模型
    model = MultiResRibNet()
    # 训练模型
    train(model, train_loader, test_loader)
 # 只为测试 111