FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2038, 640 aa 1>>>pF1KE2038 640 - 640 aa - 640 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.7164+/-0.00133; mu= 18.3852+/- 0.079 mean_var=148.8445+/-27.804, 0's: 0 Z-trim(105.9): 198 B-trim: 7 in 1/50 Lambda= 0.105125 statistics sampled from 8466 (8683) to 8466 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.63), E-opt: 0.2 (0.267), width: 16 Scan time: 3.530 The best scores are: opt bits E(32554) CCDS10583.1 UMOD gene_id:7369|Hs108|chr16 ( 640) 4550 703.1 3e-202 CCDS61876.1 UMOD gene_id:7369|Hs108|chr16 ( 673) 4374 676.4 3.4e-194 CCDS10582.2 GP2 gene_id:2813|Hs108|chr16 ( 534) 1879 297.9 2.4e-80 CCDS42128.1 GP2 gene_id:2813|Hs108|chr16 ( 537) 1863 295.4 1.3e-79 CCDS45432.1 GP2 gene_id:2813|Hs108|chr16 ( 387) 1271 205.5 1.1e-52 CCDS45433.1 GP2 gene_id:2813|Hs108|chr16 ( 390) 1271 205.5 1.1e-52 CCDS8434.1 TECTA gene_id:7007|Hs108|chr11 (2155) 757 128.5 9.3e-29 CCDS7318.1 OIT3 gene_id:170392|Hs108|chr10 ( 545) 476 85.1 2.8e-16 CCDS44864.1 NELL2 gene_id:4753|Hs108|chr12 ( 815) 410 75.3 3.6e-13 CCDS8746.1 NELL2 gene_id:4753|Hs108|chr12 ( 816) 410 75.3 3.6e-13 CCDS53781.1 NELL2 gene_id:4753|Hs108|chr12 ( 839) 410 75.3 3.7e-13 CCDS44863.1 NELL2 gene_id:4753|Hs108|chr12 ( 866) 410 75.3 3.7e-13 CCDS56214.1 UMODL1 gene_id:89766|Hs108|chr21 (1246) 392 72.8 3.1e-12 CCDS42936.1 UMODL1 gene_id:89766|Hs108|chr21 (1318) 392 72.9 3.2e-12 CCDS56215.1 UMODL1 gene_id:89766|Hs108|chr21 (1374) 392 72.9 3.3e-12 CCDS42935.1 UMODL1 gene_id:89766|Hs108|chr21 (1446) 392 72.9 3.4e-12 CCDS54344.1 LTBP1 gene_id:4052|Hs108|chr2 (1353) 366 68.9 5e-11 CCDS14069.1 FBLN1 gene_id:2192|Hs108|chr22 ( 683) 359 67.5 6.9e-11 >>CCDS10583.1 UMOD gene_id:7369|Hs108|chr16 (640 aa) initn: 4550 init1: 4550 opt: 4550 Z-score: 3744.4 bits: 703.1 E(32554): 3e-202 Smith-Waterman score: 4550; 100.0% identity (100.0% similar) in 640 aa overlap (1-640:1-640) 10 20 30 40 50 60 pF1KE2 MGQPSLTWMLMVVVASWFITTAATDTSEARWCSECHSNATCTEDEAVTTCTCQEGFTGDG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MGQPSLTWMLMVVVASWFITTAATDTSEARWCSECHSNATCTEDEAVTTCTCQEGFTGDG 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 LTCVDLDECAIPGAHNCSANSSCVNTPGSFSCVCPEGFRLSPGLGCTDVDECAEPGLSHC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LTCVDLDECAIPGAHNCSANSSCVNTPGSFSCVCPEGFRLSPGLGCTDVDECAEPGLSHC 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 HALATCVNVVGSYLCVCPAGYRGDGWHCECSPGSCGPGLDCVPEGDALVCADPCQAHRTL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 HALATCVNVVGSYLCVCPAGYRGDGWHCECSPGSCGPGLDCVPEGDALVCADPCQAHRTL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 DEYWRSTEYGEGYACDTDLRGWYRFVGQGGARMAETCVPVLRCNTAAPMWLNGTHPSSDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 DEYWRSTEYGEGYACDTDLRGWYRFVGQGGARMAETCVPVLRCNTAAPMWLNGTHPSSDE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE2 GIVSRKACAHWSGHCCLWDASVQVKACAGGYYVYNLTAPPECHLAYCTDPSSVEGTCEEC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 GIVSRKACAHWSGHCCLWDASVQVKACAGGYYVYNLTAPPECHLAYCTDPSSVEGTCEEC 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE2 SIDEDCKSNNGRWHCQCKQDFNITDISLLEHRLECGANDMKVSLGKCQLKSLGFDKVFMY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 SIDEDCKSNNGRWHCQCKQDFNITDISLLEHRLECGANDMKVSLGKCQLKSLGFDKVFMY 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE2 LSDSRCSGFNDRDNRDWVSVVTPARDGPCGTVLTRNETHATYSNTLYLADEIIIRDLNIK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LSDSRCSGFNDRDNRDWVSVVTPARDGPCGTVLTRNETHATYSNTLYLADEIIIRDLNIK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE2 INFACSYPLDMKVSLKTALQPMVSALNIRVGGTGMFTVRMALFQTPSYTQPYQGSSVTLS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 INFACSYPLDMKVSLKTALQPMVSALNIRVGGTGMFTVRMALFQTPSYTQPYQGSSVTLS 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE2 TEAFLYVGTMLDGGDLSRFALLMTNCYATPSSNATDPLKYFIIQDRCPHTRDSTIQVVEN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 TEAFLYVGTMLDGGDLSRFALLMTNCYATPSSNATDPLKYFIIQDRCPHTRDSTIQVVEN 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE2 GESSQGRFSVQMFRFAGNYDLVYLHCEVYLCDTMNEKCKPTCSGTRFRSGSVIDQSRVLN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 GESSQGRFSVQMFRFAGNYDLVYLHCEVYLCDTMNEKCKPTCSGTRFRSGSVIDQSRVLN 550 560 570 580 590 600 610 620 630 640 pF1KE2 LGPITRKGVQATVSRAFSSLGLLKVWLPLLLSATLTLTFQ :::::::::::::::::::::::::::::::::::::::: CCDS10 LGPITRKGVQATVSRAFSSLGLLKVWLPLLLSATLTLTFQ 610 620 630 640 >>CCDS61876.1 UMOD gene_id:7369|Hs108|chr16 (673 aa) initn: 4374 init1: 4374 opt: 4374 Z-score: 3599.9 bits: 676.4 E(32554): 3.4e-194 Smith-Waterman score: 4467; 95.1% identity (95.1% similar) in 672 aa overlap (2-640:2-673) 10 20 30 pF1KE2 MGQPSLTWMLMVVVASWFITTAATDTSEAR------------------------------ ::::::::::::::::::::::::::::: CCDS61 MGQPSLTWMLMVVVASWFITTAATDTSEARTKYNCPARWSWRTPQRGGDTEQGPDEDFTS 10 20 30 40 50 60 40 50 60 70 80 pF1KE2 ---WCSECHSNATCTEDEAVTTCTCQEGFTGDGLTCVDLDECAIPGAHNCSANSSCVNTP ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 QGRWCSECHSNATCTEDEAVTTCTCQEGFTGDGLTCVDLDECAIPGAHNCSANSSCVNTP 70 80 90 100 110 120 90 100 110 120 130 140 pF1KE2 GSFSCVCPEGFRLSPGLGCTDVDECAEPGLSHCHALATCVNVVGSYLCVCPAGYRGDGWH :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 GSFSCVCPEGFRLSPGLGCTDVDECAEPGLSHCHALATCVNVVGSYLCVCPAGYRGDGWH 130 140 150 160 170 180 150 160 170 180 190 200 pF1KE2 CECSPGSCGPGLDCVPEGDALVCADPCQAHRTLDEYWRSTEYGEGYACDTDLRGWYRFVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 CECSPGSCGPGLDCVPEGDALVCADPCQAHRTLDEYWRSTEYGEGYACDTDLRGWYRFVG 190 200 210 220 230 240 210 220 230 240 250 260 pF1KE2 QGGARMAETCVPVLRCNTAAPMWLNGTHPSSDEGIVSRKACAHWSGHCCLWDASVQVKAC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 QGGARMAETCVPVLRCNTAAPMWLNGTHPSSDEGIVSRKACAHWSGHCCLWDASVQVKAC 250 260 270 280 290 300 270 280 290 300 310 320 pF1KE2 AGGYYVYNLTAPPECHLAYCTDPSSVEGTCEECSIDEDCKSNNGRWHCQCKQDFNITDIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 AGGYYVYNLTAPPECHLAYCTDPSSVEGTCEECSIDEDCKSNNGRWHCQCKQDFNITDIS 310 320 330 340 350 360 330 340 350 360 370 380 pF1KE2 LLEHRLECGANDMKVSLGKCQLKSLGFDKVFMYLSDSRCSGFNDRDNRDWVSVVTPARDG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 LLEHRLECGANDMKVSLGKCQLKSLGFDKVFMYLSDSRCSGFNDRDNRDWVSVVTPARDG 370 380 390 400 410 420 390 400 410 420 430 440 pF1KE2 PCGTVLTRNETHATYSNTLYLADEIIIRDLNIKINFACSYPLDMKVSLKTALQPMVSALN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 PCGTVLTRNETHATYSNTLYLADEIIIRDLNIKINFACSYPLDMKVSLKTALQPMVSALN 430 440 450 460 470 480 450 460 470 480 490 500 pF1KE2 IRVGGTGMFTVRMALFQTPSYTQPYQGSSVTLSTEAFLYVGTMLDGGDLSRFALLMTNCY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 IRVGGTGMFTVRMALFQTPSYTQPYQGSSVTLSTEAFLYVGTMLDGGDLSRFALLMTNCY 490 500 510 520 530 540 510 520 530 540 550 560 pF1KE2 ATPSSNATDPLKYFIIQDRCPHTRDSTIQVVENGESSQGRFSVQMFRFAGNYDLVYLHCE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 ATPSSNATDPLKYFIIQDRCPHTRDSTIQVVENGESSQGRFSVQMFRFAGNYDLVYLHCE 550 560 570 580 590 600 570 580 590 600 610 620 pF1KE2 VYLCDTMNEKCKPTCSGTRFRSGSVIDQSRVLNLGPITRKGVQATVSRAFSSLGLLKVWL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 VYLCDTMNEKCKPTCSGTRFRSGSVIDQSRVLNLGPITRKGVQATVSRAFSSLGLLKVWL 610 620 630 640 650 660 630 640 pF1KE2 PLLLSATLTLTFQ ::::::::::::: CCDS61 PLLLSATLTLTFQ 670 >>CCDS10582.2 GP2 gene_id:2813|Hs108|chr16 (534 aa) initn: 1790 init1: 959 opt: 1879 Z-score: 1555.9 bits: 297.9 E(32554): 2.4e-80 Smith-Waterman score: 1879; 52.1% identity (76.0% similar) in 526 aa overlap (122-639:17-534) 100 110 120 130 140 150 pF1KE2 CVCPEGFRLSPGLGCTDVDECAEPGLSHCHALATCVNVVGSYLCVCPAGYRGDGWHCECS ::..:. : : :: : : : CCDS10 MPHLMERMVGSGLLWLALVSCI------LTQASAVQRGYGNPIEAS 10 20 30 40 160 170 180 190 200 pF1KE2 PGSCGPGLDCVPEG--DALVCADPCQAHRTLDEYWRSTEYGEG-YACDTDLRGWYRFVGQ : : ::: : .: :: :::: . ::: .:::: . : .:: .. :::::::. CCDS10 --SYGLDLDCGAPGTPEAHVCFDPCQNYTLLDEPFRSTENSAGSQGCDKNMSGWYRFVGE 50 60 70 80 90 210 220 230 240 250 260 pF1KE2 GGARMAETCVPVLRCNTAAPMWLNGTHPSSDEGIVSRKACAHWSGHCCLWDASVQVKACA ::.::.:::: : ::.: ::::::::::. .::... :::::::.::.: . : :::: CCDS10 GGVRMSETCVQVHRCQTDAPMWLNGTHPALGDGITNHTACAHWSGNCCFWKTEVLVKACP 100 110 120 130 140 150 270 280 290 300 310 320 pF1KE2 GGYYVYNLTAPPECHLAYCTDPSSVEGTCEE-CSIDEDCKSNNGRWHCQCKQDFNITDIS :::.:: : . : :.: ::::::.:: ::. : .:.: . :. : : :.::.: .:. CCDS10 GGYHVYRLEGTPWCNLRYCTDPSTVEDKCEKACRPEEECLALNSTWGCFCRQDLNSSDVH 160 170 180 190 200 210 330 340 350 360 370 380 pF1KE2 LLEHRLECGANDMKVSLGKCQLKSLGF-DKVFMYLSDSRCSGFNDRDNRDWVSVVTPARD :. .:.:: ..::.. :: : .::. ..:. :: : ::.. . ..:.::::..:.. CCDS10 SLQPQLDCGPREIKVKVDKCLLGGLGLGEEVIAYLRDPNCSSILQTEERNWVSVTSPVQA 220 230 240 250 260 270 390 400 410 420 430 440 pF1KE2 GPCGTVLTRNETHATYSNTLYLADEIIIRDLNIKINFACSYPLDMKVSLKTALQPMVSAL . : ..: ::.::: :.::: :....:::: ..::: :.:::::::::..::::.::.: CCDS10 SACRNILERNQTHAIYKNTLSLVNDFIIRDTILNINFQCAYPLDMKVSLQAALQPIVSSL 280 290 300 310 320 330 450 460 470 480 490 500 pF1KE2 NIRVGGTGMFTVRMALFQTPSYTQPYQGSSVTLSTEAFLYVGTMLDGGDLSRFALLMTNC :. : :.: : ::::::: .::.::.:..: ::.:. ::::..:. :: ::: :.. :: CCDS10 NVSVDGNGEFIVRMALFQDQNYTNPYEGDAVELSVESVLYVGAILEQGDTSRFNLVLRNC 340 350 360 370 380 390 510 520 530 540 550 560 pF1KE2 YATPSSNATDPLKYFIIQDRCPHTRDSTIQVVENGESSQGRFSVQMFRFAGNYDLVYLHC ::::. . .: .:::::.. : . :::::.: :::.::..::::::: :::.::::.::: CCDS10 YATPTEDKADLVKYFIIRNSCSNQRDSTIHVEENGQSSESRFSVQMFMFAGHYDLVFLHC 400 410 420 430 440 450 570 580 590 600 610 620 pF1KE2 EVYLCDTMNEKCKPTCSGTRFRSG-SVIDQSRVLNLGPITRKGVQA--TVSRAFSSLGLL :..:::..::.:.:.:: .. :: .:: .:::.::::::.:.:. ... . :. :.: CCDS10 EIHLCDSLNEQCQPSCSRSQVRSEVPAIDLARVLDLGPITRRGAQSPGVMNGTPSTAGFL 460 470 480 490 500 510 630 640 pF1KE2 KVWLPLLLSATLTLTFQ .: .::.. :. : CCDS10 VAWPMVLLTVLLAWLF 520 530 >>CCDS42128.1 GP2 gene_id:2813|Hs108|chr16 (537 aa) initn: 1748 init1: 959 opt: 1863 Z-score: 1542.8 bits: 295.4 E(32554): 1.3e-79 Smith-Waterman score: 1863; 51.8% identity (75.6% similar) in 529 aa overlap (122-639:17-537) 100 110 120 130 140 150 pF1KE2 CVCPEGFRLSPGLGCTDVDECAEPGLSHCHALATCVNVVGSYLCVCPAGYRGDGWHCECS ::..:. : : :: : : : CCDS42 MPHLMERMVGSGLLWLALVSCI------LTQASAVQRGYGNPIEAS 10 20 30 40 160 170 180 190 200 pF1KE2 PGSCGPGLDCVPEG--DALVCADPCQAHRTLDEYWRSTEYGEG-YACDTDLRGWYRFVGQ : : ::: : .: :: :::: . ::: .:::: . : .:: .. :::::::. CCDS42 --SYGLDLDCGAPGTPEAHVCFDPCQNYTLLDEPFRSTENSAGSQGCDKNMSGWYRFVGE 50 60 70 80 90 210 220 230 240 250 260 pF1KE2 GGARMAETCVPVLRCNTAAPMWLNGTHPSSDEGIVSRKACAHWSGHCCLWDASVQVKACA ::.::.:::: : ::.: ::::::::::. .::... :::::::.::.: . : :::: CCDS42 GGVRMSETCVQVHRCQTDAPMWLNGTHPALGDGITNHTACAHWSGNCCFWKTEVLVKACP 100 110 120 130 140 150 270 280 290 300 310 320 pF1KE2 GGYYVYNLTAPPECHLAYCT---DPSSVEGTCEE-CSIDEDCKSNNGRWHCQCKQDFNIT :::.:: : . : :.: ::: :::.:: ::. : .:.: . :. : : :.::.: . CCDS42 GGYHVYRLEGTPWCNLRYCTVPRDPSTVEDKCEKACRPEEECLALNSTWGCFCRQDLNSS 160 170 180 190 200 210 330 340 350 360 370 380 pF1KE2 DISLLEHRLECGANDMKVSLGKCQLKSLGF-DKVFMYLSDSRCSGFNDRDNRDWVSVVTP :. :. .:.:: ..::.. :: : .::. ..:. :: : ::.. . ..:.::::..: CCDS42 DVHSLQPQLDCGPREIKVKVDKCLLGGLGLGEEVIAYLRDPNCSSILQTEERNWVSVTSP 220 230 240 250 260 270 390 400 410 420 430 440 pF1KE2 ARDGPCGTVLTRNETHATYSNTLYLADEIIIRDLNIKINFACSYPLDMKVSLKTALQPMV .. . : ..: ::.::: :.::: :....:::: ..::: :.:::::::::..::::.: CCDS42 VQASACRNILERNQTHAIYKNTLSLVNDFIIRDTILNINFQCAYPLDMKVSLQAALQPIV 280 290 300 310 320 330 450 460 470 480 490 500 pF1KE2 SALNIRVGGTGMFTVRMALFQTPSYTQPYQGSSVTLSTEAFLYVGTMLDGGDLSRFALLM :.::. : :.: : ::::::: .::.::.:..: ::.:. ::::..:. :: ::: :.. CCDS42 SSLNVSVDGNGEFIVRMALFQDQNYTNPYEGDAVELSVESVLYVGAILEQGDTSRFNLVL 340 350 360 370 380 390 510 520 530 540 550 560 pF1KE2 TNCYATPSSNATDPLKYFIIQDRCPHTRDSTIQVVENGESSQGRFSVQMFRFAGNYDLVY ::::::. . .: .:::::.. : . :::::.: :::.::..::::::: :::.::::. CCDS42 RNCYATPTEDKADLVKYFIIRNSCSNQRDSTIHVEENGQSSESRFSVQMFMFAGHYDLVF 400 410 420 430 440 450 570 580 590 600 610 620 pF1KE2 LHCEVYLCDTMNEKCKPTCSGTRFRSG-SVIDQSRVLNLGPITRKGVQA--TVSRAFSSL ::::..:::..::.:.:.:: .. :: .:: .:::.::::::.:.:. ... . :. CCDS42 LHCEIHLCDSLNEQCQPSCSRSQVRSEVPAIDLARVLDLGPITRRGAQSPGVMNGTPSTA 460 470 480 490 500 510 630 640 pF1KE2 GLLKVWLPLLLSATLTLTFQ :.: .: .::.. :. : CCDS42 GFLVAWPMVLLTVLLAWLF 520 530 >>CCDS45432.1 GP2 gene_id:2813|Hs108|chr16 (387 aa) initn: 1216 init1: 959 opt: 1271 Z-score: 1059.1 bits: 205.5 E(32554): 1.1e-52 Smith-Waterman score: 1271; 51.4% identity (79.8% similar) in 356 aa overlap (289-639:32-387) 260 270 280 290 300 310 pF1KE2 DASVQVKACAGGYYVYNLTAPPECHLAYCTDPSSVEGTCEE-CSIDEDCKSNNGRWHCQC :::.:: ::. : .:.: . :. : : : CCDS45 PHLMERMVGSGLLWLALVSCILTQASAVQRDPSTVEDKCEKACRPEEECLALNSTWGCFC 10 20 30 40 50 60 320 330 340 350 360 370 pF1KE2 KQDFNITDISLLEHRLECGANDMKVSLGKCQLKSLGF-DKVFMYLSDSRCSGFNDRDNRD .::.: .:. :. .:.:: ..::.. :: : .::. ..:. :: : ::.. . ..:. CCDS45 RQDLNSSDVHSLQPQLDCGPREIKVKVDKCLLGGLGLGEEVIAYLRDPNCSSILQTEERN 70 80 90 100 110 120 380 390 400 410 420 430 pF1KE2 WVSVVTPARDGPCGTVLTRNETHATYSNTLYLADEIIIRDLNIKINFACSYPLDMKVSLK ::::..:.. . : ..: ::.::: :.::: :....:::: ..::: :.:::::::::. CCDS45 WVSVTSPVQASACRNILERNQTHAIYKNTLSLVNDFIIRDTILNINFQCAYPLDMKVSLQ 130 140 150 160 170 180 440 450 460 470 480 490 pF1KE2 TALQPMVSALNIRVGGTGMFTVRMALFQTPSYTQPYQGSSVTLSTEAFLYVGTMLDGGDL .::::.::.::. : :.: : ::::::: .::.::.:..: ::.:. ::::..:. :: CCDS45 AALQPIVSSLNVSVDGNGEFIVRMALFQDQNYTNPYEGDAVELSVESVLYVGAILEQGDT 190 200 210 220 230 240 500 510 520 530 540 550 pF1KE2 SRFALLMTNCYATPSSNATDPLKYFIIQDRCPHTRDSTIQVVENGESSQGRFSVQMFRFA ::: :.. ::::::. . .: .:::::.. : . :::::.: :::.::..::::::: :: CCDS45 SRFNLVLRNCYATPTEDKADLVKYFIIRNSCSNQRDSTIHVEENGQSSESRFSVQMFMFA 250 260 270 280 290 300 560 570 580 590 600 610 pF1KE2 GNYDLVYLHCEVYLCDTMNEKCKPTCSGTRFRSG-SVIDQSRVLNLGPITRKGVQA--TV :.::::.::::..:::..::.:.:.:: .. :: .:: .:::.::::::.:.:. .. CCDS45 GHYDLVFLHCEIHLCDSLNEQCQPSCSRSQVRSEVPAIDLARVLDLGPITRRGAQSPGVM 310 320 330 340 350 360 620 630 640 pF1KE2 SRAFSSLGLLKVWLPLLLSATLTLTFQ . . :. :.: .: .::.. :. : CCDS45 NGTPSTAGFLVAWPMVLLTVLLAWLF 370 380 >>CCDS45433.1 GP2 gene_id:2813|Hs108|chr16 (390 aa) initn: 1216 init1: 959 opt: 1271 Z-score: 1059.1 bits: 205.5 E(32554): 1.1e-52 Smith-Waterman score: 1271; 51.4% identity (79.8% similar) in 356 aa overlap (289-639:35-390) 260 270 280 290 300 310 pF1KE2 DASVQVKACAGGYYVYNLTAPPECHLAYCTDPSSVEGTCEE-CSIDEDCKSNNGRWHCQC :::.:: ::. : .:.: . :. : : : CCDS45 MERMVGSGLLWLALVSCILTQASAVQRVPRDPSTVEDKCEKACRPEEECLALNSTWGCFC 10 20 30 40 50 60 320 330 340 350 360 370 pF1KE2 KQDFNITDISLLEHRLECGANDMKVSLGKCQLKSLGF-DKVFMYLSDSRCSGFNDRDNRD .::.: .:. :. .:.:: ..::.. :: : .::. ..:. :: : ::.. . ..:. CCDS45 RQDLNSSDVHSLQPQLDCGPREIKVKVDKCLLGGLGLGEEVIAYLRDPNCSSILQTEERN 70 80 90 100 110 120 380 390 400 410 420 430 pF1KE2 WVSVVTPARDGPCGTVLTRNETHATYSNTLYLADEIIIRDLNIKINFACSYPLDMKVSLK ::::..:.. . : ..: ::.::: :.::: :....:::: ..::: :.:::::::::. CCDS45 WVSVTSPVQASACRNILERNQTHAIYKNTLSLVNDFIIRDTILNINFQCAYPLDMKVSLQ 130 140 150 160 170 180 440 450 460 470 480 490 pF1KE2 TALQPMVSALNIRVGGTGMFTVRMALFQTPSYTQPYQGSSVTLSTEAFLYVGTMLDGGDL .::::.::.::. : :.: : ::::::: .::.::.:..: ::.:. ::::..:. :: CCDS45 AALQPIVSSLNVSVDGNGEFIVRMALFQDQNYTNPYEGDAVELSVESVLYVGAILEQGDT 190 200 210 220 230 240 500 510 520 530 540 550 pF1KE2 SRFALLMTNCYATPSSNATDPLKYFIIQDRCPHTRDSTIQVVENGESSQGRFSVQMFRFA ::: :.. ::::::. . .: .:::::.. : . :::::.: :::.::..::::::: :: CCDS45 SRFNLVLRNCYATPTEDKADLVKYFIIRNSCSNQRDSTIHVEENGQSSESRFSVQMFMFA 250 260 270 280 290 300 560 570 580 590 600 610 pF1KE2 GNYDLVYLHCEVYLCDTMNEKCKPTCSGTRFRSG-SVIDQSRVLNLGPITRKGVQA--TV :.::::.::::..:::..::.:.:.:: .. :: .:: .:::.::::::.:.:. .. CCDS45 GHYDLVFLHCEIHLCDSLNEQCQPSCSRSQVRSEVPAIDLARVLDLGPITRRGAQSPGVM 310 320 330 340 350 360 620 630 640 pF1KE2 SRAFSSLGLLKVWLPLLLSATLTLTFQ . . :. :.: .: .::.. :. : CCDS45 NGTPSTAGFLVAWPMVLLTVLLAWLF 370 380 390 >>CCDS8434.1 TECTA gene_id:7007|Hs108|chr11 (2155 aa) initn: 690 init1: 407 opt: 757 Z-score: 629.8 bits: 128.5 E(32554): 9.3e-29 Smith-Waterman score: 757; 35.8% identity (69.4% similar) in 327 aa overlap (293-607:1761-2083) 270 280 290 300 310 320 pF1KE2 QVKACAGGYYVYNLTAPPECHLAYCTDPSSVEGTC--EECSIDEDCKSNNGRWHCQCKQD :: : .: .. :. .::: : : . CCDS84 CGSLAAYGEACRSFGILSTEWIEKENCSGVVEDPCVGADCP-NRTCELGNGRELCGCIEP 1740 1750 1760 1770 1780 330 340 350 360 370 pF1KE2 --FNITDISLLEHRLECGANDMKVSLGKCQLKSLGFDKVFMYLSDSRCSGFNDRDNRDWV .. .. .... .. : : .:.::..::.: .:::.. . ..: .:.:. ...:.. CCDS84 PPYGNNSHDIIDAEVTCKAAQMEVSISKCKLFQLGFEREGVRINDRQCTGI---EGEDFI 1790 1800 1810 1820 1830 1840 380 390 400 410 420 430 pF1KE2 SVVTPARDGPCGTVLTRNETHATYSNTLYLAD-----EIIIRDLNIKINFACSYPLDMKV : : ::... : :: :.:::.. . .:: :: .:...:.:.: ::.:. CCDS84 SFQINNTKGNCGNIVQSNGTHIMYKNTLWIESANNTGNIITRDRTINVEFSCAYELDIKI 1850 1860 1870 1880 1890 1900 440 450 460 470 480 490 pF1KE2 SLKTALQPMVSALNIRVGGT-GMFTVRMALFQTPSYTQPYQGSSVTLSTEAFLYVGTMLD :: ....::.:..:. : : : ..:::... :: .::. . :.:.:. ::::... CCDS84 SLDSVVKPMLSVINLTVPTQEGSFITKMALYKNASYKHPYRQGEVVLTTRDVLYVGVFVV 1910 1920 1930 1940 1950 1960 500 510 520 530 540 550 pF1KE2 GGDLSRFALLMTNCYATPSSNATDPLKYFIIQDRCPHTRDSTIQVVENGESSQGRFSVQM :.: ... : ...:::::. ...: :.::::. : . .:.:: . ::. : :: : . CCDS84 GADATHLILTLNKCYATPTRDSNDKLRYFIIEGGCQNLKDNTIGIEENAVSLTCRFHVTV 1970 1980 1990 2000 2010 2020 560 570 580 590 600 610 pF1KE2 FRFAGNYDLVYLHCEVYLCDTMNEKCKPTCS-GTRFRSGSVID-QSRVLNLGPITRKGVQ :.: :.:: :.::: : :::. . .:: :: ..:. . . . . .....::: :: CCDS84 FKFIGDYDEVHLHCAVSLCDSEKYSCKITCPHNSRIATDYTKEPKEQIISVGPIRRKRLD 2030 2040 2050 2060 2070 2080 620 630 640 pF1KE2 ATVSRAFSSLGLLKVWLPLLLSATLTLTFQ CCDS84 WCEDNGGCEQICTSRVDGPLCSCVTGTLQEDGKSCRASNSSMELQVWTLLLIMIQISLWH 2090 2100 2110 2120 2130 2140 >>CCDS7318.1 OIT3 gene_id:170392|Hs108|chr10 (545 aa) initn: 478 init1: 386 opt: 476 Z-score: 405.9 bits: 85.1 E(32554): 2.8e-16 Smith-Waterman score: 665; 28.4% identity (52.8% similar) in 511 aa overlap (169-591:20-521) 140 150 160 170 180 190 pF1KE2 AGYRGDGWHCECSPGSCGPGLDCVPEGDALVCADPCQAHRTLDEYWRSTEY----GEGYA : :::.:. .:.: ::.:.. ..: CCDS73 MPPFLLLTCLFITGTSVSPVALDPCSAYISLNEPWRNTDHQLDESQGPP 10 20 30 40 200 210 220 230 240 250 pF1KE2 -CDTDLRG-WYRFVGQGGARMAETCVPVLRCNTAAPMWLNGTHPSSDEGIVSRKACAHWS ::. . : ::.:.:..: : :.: .:.: ::.::::.:: .:::.:.::: .. CCDS73 LCDNHVNGEWYHFTGMAGDAMPTFCIPENHCGTHAPVWLNGSHPLEGDGIVQRQACASFN 50 60 70 80 90 100 260 270 280 290 300 310 pF1KE2 GHCCLWDASVQVKACAGGYYVYNLTAPPECHLAYCTDPSSV-EGTCE-ECSIDEDCKSNN :.::::...:.:::: :::::: :: : : .:: .. . :. :: .: CCDS73 GNCCLWNTTVEVKACPGGYYVYRLTKPSVCFHVYCGHFYDICDEDCHGSCSDTSECTCAP 110 120 130 140 150 160 320 330 340 pF1KE2 G------RWHC----QCKQDFN-ITDISL-LE--HRLECGANDMKVSLGK---------- : : : .:.:. . ..: . :. .: :::.. . : :: CCDS73 GTVLGPDRQTCFDENECEQNNGGCSEICVNLKNSYRCECGVGRVLRSDGKTCEDVEGCHN 170 180 190 200 210 220 350 360 pF1KE2 ----CQLKSLGFDKVF-----------------------------------------MYL :. . :: .: . ..: CCDS73 NNGGCSHSCLGSEKGYQCECPRGLVLSEDNHTCQVPVLCKSNAIEVNIPRELVGGLELFL 230 240 250 260 270 280 370 380 390 400 410 pF1KE2 SDSRCSGFNDRDNRDWVSVVTPARDGPCGTVLTRNETHATYSNTLY--------LADEII ... : : . : :... . ::::. . . . :: . . ..: CCDS73 TNTSCRGVS---NGTHVNILFSLKT--CGTVVDVVNDKIVASNLVTGLPKQTPGSSGDFI 290 300 310 320 330 340 420 430 440 450 460 470 pF1KE2 IRDLNIKINFACSYPLDMKVSLKTALQPMVSALNIRVGGTGMFTVRMALFQTPSYTQPYQ :: .. : .: .: . .: . . : :.: . :.: . .:. . .::. CCDS73 IRTSKLLIPVTCEFPRLYTISEGYVPNLRNSPLEIMSRNHGIFPFTLEIFKDNEFEEPYR 350 360 370 380 390 400 480 490 500 510 520 530 pF1KE2 GSSVTLSTEAFLYVGTMLDGGDLSRFALLMTNCYATPSSNATDPLKYFIIQDRCPHTRDS . ::. . :: : . .: . :. .:.:::.:. . :::..:.: : . :. CCDS73 EALPTLKLRDSLYFG-IEPVVHVSGLESLVESCFATPTSKIDEVLKYYLIRDGC--VSDD 410 420 430 440 450 460 540 550 560 570 580 590 pF1KE2 TIQVVENGESSQGRFSVQMFRFAG-NYDLVYLHCEVYLCDTMNEK--CKPTCSGTRFRSG ... . . .:.: .:.:.: .. :.:::.: .: ...:. : : :.: : CCDS73 SVKQYTSRDHLAKHFQVPVFKFVGKDHKEVFLHCRVLVCGVLDERSRCAQGCH-RRMRRG 470 480 490 500 510 520 600 610 620 630 640 pF1KE2 SVIDQSRVLNLGPITRKGVQATVSRAFSSLGLLKVWLPLLLSATLTLTFQ . CCDS73 AGGEDSAGLQGQTLTGGPIRIDWED 530 540 >>CCDS44864.1 NELL2 gene_id:4753|Hs108|chr12 (815 aa) initn: 337 init1: 161 opt: 410 Z-score: 349.9 bits: 75.3 E(32554): 3.6e-13 Smith-Waterman score: 446; 29.9% identity (49.1% similar) in 338 aa overlap (31-319:399-720) 10 20 30 40 50 pF1KE2 MGQPSLTWMLMVVVASWFITTAATDTSEARWCSE---CHSNATCTEDEAVTTCTCQEGFT .::: : :. : . . ..:.:..:: CCDS44 ESSGCPALDCPESHQITLSHSCCKVCKGYDFCSERHNCMENSICRNLNDRAVCSCRDGFR 370 380 390 400 410 420 60 70 80 90 100 110 pF1KE2 G---DGLTCVDLDECAIPGAHNCSANSSCVNTPGSFSCVCPEGFRLSPGLGCTDVDECAE . :. : :.:::: : : : :. :::::::: :.: :. .::. ::: CCDS44 ALREDNAYCEDIDECA-EGRHYCRENTMCVNTPGSFMCICKTGYIRIDDYSCTEHDECIT 430 440 450 460 470 480 120 130 140 150 160 170 pF1KE2 PGLSHCHALATCVNVVGSYLCVCPAGYRGDGWHCE--CSPGSCGPGLDCVPEGDALVCAD . .: : : :.::.. ::: :: :.: :. :. : : : :. : ::: CCDS44 -NQHNCDENALCFNTVGGHNCVCKPGYTGNGTTCKAFCKDG-CRNGGACIA---ANVCAC 490 500 510 520 530 540 180 190 200 210 pF1KE2 PCQAHRTLDEYWRSTEYGEGYA-CDT-----DLRGWYRFVGQGGAR-------MAETCVP : :. . : ..:.. ::. .: :::. . : . .:.: CCDS44 P-QGFTGPSCETDIDECSDGFVQCDSRANCINLPGWYHCECRDGYHDNGMFSPSGESCED 550 560 570 580 590 600 220 230 240 250 260 pF1KE2 VLRCNTAAPMWLNGT-HPSSDEGIVSRKACAHWSGHC---CLWDASVQ------------ . .:.:. : : . : : : : : . .: :. :..:. CCDS44 IDECGTGRHSCANDTICFNLDGGYDCR--CPH-GKNCTGDCIHDGKVKHNGQIWVLENDR 610 620 630 640 650 270 280 290 300 310 pF1KE2 --VKACAGGYYVYNLTAPPECHLAYCTDPSSVEGTCEECS--IDEDCKSNNGR------- : .: .:. . . : : .:. : ::. .. .: .::. CCDS44 CSVCSCQNGFVMCRRMV---CD---CENPTVDLFCCPECDPRLSSQCLHQNGETLYNSGD 660 670 680 690 700 710 320 330 340 350 360 370 pF1KE2 -WHCQCKQDFNITDISLLEHRLECGANDMKVSLGKCQLKSLGFDKVFMYLSDSRCSGFND : .:.: CCDS44 TWVQNCQQCRCLQGEVDCWPLPCPDVECEFSILPENECCPRCVTDPCQADTIRNDITKTC 720 730 740 750 760 770 >>CCDS8746.1 NELL2 gene_id:4753|Hs108|chr12 (816 aa) initn: 337 init1: 161 opt: 410 Z-score: 349.9 bits: 75.3 E(32554): 3.6e-13 Smith-Waterman score: 446; 29.9% identity (49.1% similar) in 338 aa overlap (31-319:400-721) 10 20 30 40 50 pF1KE2 MGQPSLTWMLMVVVASWFITTAATDTSEARWCSE---CHSNATCTEDEAVTTCTCQEGFT .::: : :. : . . ..:.:..:: CCDS87 ESSGCPALDCPESHQITLSHSCCKVCKGYDFCSERHNCMENSICRNLNDRAVCSCRDGFR 370 380 390 400 410 420 60 70 80 90 100 110 pF1KE2 G---DGLTCVDLDECAIPGAHNCSANSSCVNTPGSFSCVCPEGFRLSPGLGCTDVDECAE . :. : :.:::: : : : :. :::::::: :.: :. .::. ::: CCDS87 ALREDNAYCEDIDECA-EGRHYCRENTMCVNTPGSFMCICKTGYIRIDDYSCTEHDECIT 430 440 450 460 470 480 120 130 140 150 160 170 pF1KE2 PGLSHCHALATCVNVVGSYLCVCPAGYRGDGWHCE--CSPGSCGPGLDCVPEGDALVCAD . .: : : :.::.. ::: :: :.: :. :. : : : :. : ::: CCDS87 -NQHNCDENALCFNTVGGHNCVCKPGYTGNGTTCKAFCKDG-CRNGGACIA---ANVCAC 490 500 510 520 530 540 180 190 200 210 pF1KE2 PCQAHRTLDEYWRSTEYGEGYA-CDT-----DLRGWYRFVGQGGAR-------MAETCVP : :. . : ..:.. ::. .: :::. . : . .:.: CCDS87 P-QGFTGPSCETDIDECSDGFVQCDSRANCINLPGWYHCECRDGYHDNGMFSPSGESCED 550 560 570 580 590 600 220 230 240 250 260 pF1KE2 VLRCNTAAPMWLNGT-HPSSDEGIVSRKACAHWSGHC---CLWDASVQ------------ . .:.:. : : . : : : : : . .: :. :..:. CCDS87 IDECGTGRHSCANDTICFNLDGGYDCR--CPH-GKNCTGDCIHDGKVKHNGQIWVLENDR 610 620 630 640 650 270 280 290 300 310 pF1KE2 --VKACAGGYYVYNLTAPPECHLAYCTDPSSVEGTCEECS--IDEDCKSNNGR------- : .: .:. . . : : .:. : ::. .. .: .::. CCDS87 CSVCSCQNGFVMCRRMV---CD---CENPTVDLFCCPECDPRLSSQCLHQNGETLYNSGD 660 670 680 690 700 710 320 330 340 350 360 370 pF1KE2 -WHCQCKQDFNITDISLLEHRLECGANDMKVSLGKCQLKSLGFDKVFMYLSDSRCSGFND : .:.: CCDS87 TWVQNCQQCRCLQGEVDCWPLPCPDVECEFSILPENECCPRCVTDPCQADTIRNDITKTC 720 730 740 750 760 770 640 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 14:07:03 2016 done: Sun Nov 6 14:07:03 2016 Total Scan time: 3.530 Total Display time: 0.110 Function used was FASTA [36.3.4 Apr, 2011]