FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE3267, 662 aa 1>>>pF1KE3267 662 - 662 aa - 662 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.0493+/- 0.001; mu= 15.2676+/- 0.060 mean_var=67.4365+/-13.868, 0's: 0 Z-trim(103.7): 24 B-trim: 130 in 2/48 Lambda= 0.156180 statistics sampled from 7511 (7522) to 7511 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.596), E-opt: 0.2 (0.231), width: 16 Scan time: 2.560 The best scores are: opt bits E(32554) CCDS3873.1 FASTKD3 gene_id:79072|Hs108|chr5 ( 662) 4393 999.2 0 CCDS13048.1 FASTKD5 gene_id:60493|Hs108|chr20 ( 764) 298 76.6 1.5e-13 CCDS33318.1 FASTKD1 gene_id:79675|Hs108|chr2 ( 847) 257 67.3 9.9e-11 >>CCDS3873.1 FASTKD3 gene_id:79072|Hs108|chr5 (662 aa) initn: 4393 init1: 4393 opt: 4393 Z-score: 5344.5 bits: 999.2 E(32554): 0 Smith-Waterman score: 4393; 99.8% identity (100.0% similar) in 662 aa overlap (1-662:1-662) 10 20 30 40 50 60 pF1KE3 MALITLRKNLYRLSDFQMHRALAALKNKPLNHVHKVVKERLCPWLCSRQPEPFGVRFHHA :::::::::::::::::::::::::::::::::::::::::::::::::::::::.:::: CCDS38 MALITLRKNLYRLSDFQMHRALAALKNKPLNHVHKVVKERLCPWLCSRQPEPFGVKFHHA 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE3 HCKKFHSKNGNDLHPLGGPVFSQVSDCDRLEQNVKNEESQMFYRRLSNLTSSEEVLSFIS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS38 HCKKFHSKNGNDLHPLGGPVFSQVSDCDRLEQNVKNEESQMFYRRLSNLTSSEEVLSFIS 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE3 TMETLPDTMAAGALQRICEVEKKDGDQGLPKEILENSIFQALCFQFEKEPSQLSNTSLVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS38 TMETLPDTMAAGALQRICEVEKKDGDQGLPKEILENSIFQALCFQFEKEPSQLSNTSLVT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE3 ALQALILLHVDPQSSLLLNLVAECQNRLRKGGMEVRNLCILGESLITLHSSGCVTLELII :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS38 ALQALILLHVDPQSSLLLNLVAECQNRLRKGGMEVRNLCILGESLITLHSSGCVTLELII 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE3 NQLQGEKLETFTPEDIVALYRILQACTEKVDEHQTFLNKINNFSLSIVSNLSPKLISQML :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS38 NQLQGEKLETFTPEDIVALYRILQACTEKVDEHQTFLNKINNFSLSIVSNLSPKLISQML 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE3 TALVVLDQSQAFPLIIKLGKYVVRHVPHFTNEELRRVLEAFIYFGHHDTFFTKALEHRVA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS38 TALVVLDQSQAFPLIIKLGKYVVRHVPHFTNEELRRVLEAFIYFGHHDTFFTKALEHRVA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE3 AVCLTLDPEVVCRVMEYCSRELILSKPILNAVAETFVCQTEKFSPRQISALMEPFGKLNY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS38 AVCLTLDPEVVCRVMEYCSRELILSKPILNAVAETFVCQTEKFSPRQISALMEPFGKLNY 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE3 LPPNASALFRKLENVLFTHFNYFPPKSLLKLLHSCSLNECHPVNFLAKIFKPLFLQRLQG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS38 LPPNASALFRKLENVLFTHFNYFPPKSLLKLLHSCSLNECHPVNFLAKIFKPLFLQRLQG 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE3 KESHLDTLSRAQLTQLFLASVLECPFYKGPKLLPKYQVKSFLTPCCSLETPVDSQLYRYV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS38 KESHLDTLSRAQLTQLFLASVLECPFYKGPKLLPKYQVKSFLTPCCSLETPVDSQLYRYV 490 500 510 520 530 540 550 560 570 580 590 600 pF1KE3 KIGLTNLLGARLYFAPKVLTPYCYTIDVEIKLDEEGFVLPSTANEDIHKRIALCIDGPKR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS38 KIGLTNLLGARLYFAPKVLTPYCYTIDVEIKLDEEGFVLPSTANEDIHKRIALCIDGPKR 550 560 570 580 590 600 610 620 630 640 650 660 pF1KE3 FCSNSKHLLGKEAIKQRHLQLLGYQVVQIPYHEIGMLKSRRELVEYLQRKLFSQNTVHWL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS38 FCSNSKHLLGKEAIKQRHLQLLGYQVVQIPYHEIGMLKSRRELVEYLQRKLFSQNTVHWL 610 620 630 640 650 660 pF1KE3 QE :: CCDS38 QE >>CCDS13048.1 FASTKD5 gene_id:60493|Hs108|chr20 (764 aa) initn: 219 init1: 122 opt: 298 Z-score: 356.8 bits: 76.6 E(32554): 1.5e-13 Smith-Waterman score: 301; 21.2% identity (56.1% similar) in 524 aa overlap (80-589:117-615) 50 60 70 80 90 100 pF1KE3 PEPFGVRFHHAHCKKFHSKNGNDLHPLGGPVFSQVSDCDRLEQNVKNEESQMFYRRLSNL :: :. :... .: ::.. .. CCDS13 KASTLQLGSPRATGVDEEDVEVFDSFENMRVFLQLRPEYRVHSYNASETSQLL-----SV 90 100 110 120 130 140 110 120 130 140 150 160 pF1KE3 TSSEEVLSFISTMETLPDTMAAGALQRICEVEKKDGDQGLPKEILENSIFQALCFQFEKE . .: .: . . .. . .: .. .:.. . ..: : .: .. : :: :. . CCDS13 SEGELILHKVRVNQN--NLQAQVIVDYLCKLSSLPAEQH-PV-LLGSTSFALLC-QLSVK 150 160 170 180 190 170 180 190 200 210 220 pF1KE3 PSQLSNTS-LVTALQALILLHVDPQSSLLLNLV-AECQNRLRKGGMEVRNLCILGESLIT :: .:. :...:.:...: . :.: .:.. ..: ... . .:. .: .... CCDS13 KIQLFDTQDLINVLKAFVILGI-PHSHSMLDVYETKCCHQVWEMNMD--QLLLVADLWRY 200 210 220 230 240 250 230 240 250 260 270 280 pF1KE3 LHSSGCVTLELIINQLQGEKLETFTPEDIVALYRILQACTEKVDEHQTFLNKINNFSLSI : . :... . :. . . .. ..: : .. :. . : ...:.... :. CCDS13 LGRKVPRFLNIFSSYLN-LHWKDLSLSQLVHLIYVI---GENRQVSQDLMQKLESLILKY 260 270 280 290 300 290 300 310 320 330 340 pF1KE3 VSNLSPKLISQMLTALVVLDQSQAFPLIIKLGKYVVRHVPHFTNEELRRVLEAFIYFGHH .. .. . .. . .. . . . .. :.: . .. :.... : ... : : : CCDS13 IDLINLEEVGTICLGFFKSSTNLSEFVMRKIGDLACANIQHLSSRSLVNIVKMF-RFTHV 310 320 330 340 350 360 350 360 370 380 390 400 pF1KE3 DTF-FTKALEHRVAAVCLTLDPEVVCRVMEYCSRELILSKPILNAVAETFVCQTEKFSPR : . : : . . . .: . : .. ::: .:.. ..:::: .. .. . . CCDS13 DHINFMKQIGEIAPQRIPSLGVQGVMHLTLYCSALRFLNEGVMNAVAASLPPRVAHCRSK 370 380 390 400 410 420 410 420 430 440 450 460 pF1KE3 QISALMEPFGKLNYLPPNASALFRKLENVL---FTHFNYFP---PKSLLKLLHSCSLNEC ... .. :: ::: :::: .. .: . . . .:: .: : :: : .. : CCDS13 DVAKILWSFGTLNYKPPNAEEFYSSLISEIHRKMPEFNQYPEHLPTCLLGL----AFLEY 430 440 450 460 470 480 470 480 490 500 510 520 pF1KE3 HPVNFLAKIFKPLFLQRLQGKESHLDTLSRAQLTQLFLASVLECPFYKGPKLLPKYQVKS ::... ..: :. :: .....: :. .: : . .::: :.: .: . : .. CCDS13 FPVELIDFALSPGFV-RLAQERTKFDLLK--ELYTLDGTVGIECPDYRGNRLSTHLQQEG 490 500 510 520 530 540 530 540 550 560 570 pF1KE3 FLTPCCSLETPVDSQ-LYRYVKIGLTNLLGARLYFAPKVLTPYCYTIDVEIKLDEEGFVL : ..:. . . . : ..::. : ... :. . :.:..:: . : CCDS13 SELLWYLAEKDMNSKPEFLETVFLLETMLGGPQYVKHHMILPHTRSSDLEVQLDVNLKPL 550 560 570 580 590 600 580 590 600 610 620 630 pF1KE3 P----STANEDIHKRIALCIDGPKRFCSNSKHLLGKEAIKQRHLQLLGYQVVQIPYHEIG : .: :.. : CCDS13 PFNREATPAENVAKLRLEHVGVSLTDDLMNKLLKGKARGHFQGKTESEPGQQPMELENKA 610 620 630 640 650 660 >>CCDS33318.1 FASTKD1 gene_id:79675|Hs108|chr2 (847 aa) initn: 395 init1: 149 opt: 257 Z-score: 306.1 bits: 67.3 E(32554): 9.9e-11 Smith-Waterman score: 360; 26.1% identity (53.4% similar) in 509 aa overlap (211-654:349-842) 190 200 210 220 230 pF1KE3 ALQALILLHVDPQSSLLLNLVAECQNRLRKGGMEVRNLCILGE--SLITLHSSGCVTLEL : :: :: :.. . :.. : .: ::: CCDS33 PEEKKQLKSTMLLMSEDLTGEQALAVLGAMGDMESRNSCLIKRVTSVLHKHLDGYKPLEL 320 330 340 350 360 370 240 250 260 270 pF1KE3 I-INQ----LQGEKLE---------------TFTPEDIVALYRILQAC-TEKVDEHQTFL . :.: :. .. : .: : .. .: : .. . ..:: . . CCDS33 LKITQELTFLHFQRKEFFAKLRELLLSYLKNSFIPTEVSVLVRAISLLPSPHLDE--VGI 380 390 400 410 420 430 280 290 300 310 320 330 pF1KE3 NKINNF----SLSIVSNLSPKLISQMLTALVVLDQSQA--FPLIIKLGKYVVRHVPHFTN ..:. .:. .:... ... . . ::. : . :. :: .: ... : .. CCDS33 SRIEAVLPQCDLNNLSSFATSVLRWIQHDHMYLDNMTAKQLKLLQKLDHYGRQRLQHSNS 440 450 460 470 480 490 340 350 360 370 380 pF1KE3 EEL-RRVLEAFIYFGHHDTFFTKALEHRVAAVCLTLDPEVVCRVME---YCSRELILSKP .: :. :... . .:: . ::. .:.. .: : : . : :: CCDS33 LDLLRKELKSL----KGNTFPESLLEEMIATLQHFMDDINYINVGEIASFISSTDYLSTL 500 510 520 530 540 550 390 400 410 420 430 440 pF1KE3 ILNAVAETFVCQTEKFSPRQISALMEPFGKLNYLPPNASALFRKLENVLFTHFNYFPPKS .:. .: . : : ::. : : :...::. ::: ::. . .. . : .... . : CCDS33 LLDRIASVAVQQIEKIHPFTIPAIIRPFSVLNYDPPQRDEFLGTCVQHLNSYLGILDPFI 560 570 580 590 600 610 450 460 470 480 490 500 pF1KE3 LLKLLHSCSLNECHPVNFLAKIFKPLFLQRLQGKESHLDTLS-----RAQ--LTQLFLAS :. : : . : : ..: ::. :: :: .:.:. :: :.: : .: . CCDS33 LVFLGFSLATLEYFPEDLLKAIFNIKFLARL---DSQLEILSPSRSARVQFHLMELNRSV 620 630 640 650 660 510 520 530 540 550 560 pF1KE3 VLECPFYKGPKLLPKYQVKSFLTPCCSLETPVDSQLYRYVKIGLTNLLGARLYFAPKVLT :::: .. : . .. ... ... ...:.... :...::. .::: CCDS33 CLECPEFQIPWFHDRF-CQQYNKGIGGMDG-TQQQIFKM----LAEVLGGINCVKASVLT 670 680 690 700 710 720 570 580 590 pF1KE3 PYCYTIDVEIKLDEEGFVLPS---------------TANEDI--------HKRIALCIDG :: . .: : ::.. :: .: .: .:::: . CCDS33 PYYHKVDFECILDKRKKPLPYGSHNIALGQLPEMPWESNIEIVGSRLPPGAERIALEFLD 730 740 750 760 770 780 600 610 620 630 640 650 pF1KE3 PKRFCSNSKHLLGKEAIKQRHLQLLGYQVVQIPYHEIG--MLKSRRELVEYLQRKLFSQN : .: : :. :: :.:.:::..:::.:.:: : . :... ..::.. .:.. CCDS33 SKALCRNIPHMKGKSAMKKRHLEILGYRVIQISQFEWNSMALSTKDARMDYLRECIFGEV 790 800 810 820 830 840 660 pF1KE3 TVHWLQE CCDS33 KSCL 662 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 19:19:31 2016 done: Mon Nov 7 19:19:31 2016 Total Scan time: 2.560 Total Display time: 0.030 Function used was FASTA [36.3.4 Apr, 2011]