FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2611, 295 aa 1>>>pF1KE2611 295 - 295 aa - 295 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.2220+/-0.000891; mu= 14.9927+/- 0.053 mean_var=57.1448+/-11.660, 0's: 0 Z-trim(105.3): 27 B-trim: 227 in 2/46 Lambda= 0.169662 statistics sampled from 8354 (8376) to 8354 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.626), E-opt: 0.2 (0.257), width: 16 Scan time: 2.070 The best scores are: opt bits E(32554) CCDS10165.1 AQP9 gene_id:366|Hs108|chr15 ( 295) 1929 480.4 6.8e-136 CCDS81887.1 AQP9 gene_id:366|Hs108|chr15 ( 230) 1516 379.3 1.5e-105 CCDS1065.1 AQP10 gene_id:89872|Hs108|chr1 ( 301) 953 241.5 5.7e-64 CCDS6542.1 AQP3 gene_id:360|Hs108|chr9 ( 292) 952 241.3 6.5e-64 CCDS6541.1 AQP7 gene_id:364|Hs108|chr9 ( 342) 830 211.4 7.3e-55 CCDS83354.1 AQP7 gene_id:364|Hs108|chr9 ( 256) 702 180.1 1.5e-45 CCDS83356.1 AQP7 gene_id:364|Hs108|chr9 ( 257) 702 180.1 1.5e-45 CCDS83353.1 AQP7 gene_id:364|Hs108|chr9 ( 216) 620 160.0 1.5e-39 >>CCDS10165.1 AQP9 gene_id:366|Hs108|chr15 (295 aa) initn: 1929 init1: 1929 opt: 1929 Z-score: 2553.2 bits: 480.4 E(32554): 6.8e-136 Smith-Waterman score: 1929; 99.7% identity (100.0% similar) in 295 aa overlap (1-295:1-295) 10 20 30 40 50 60 pF1KE2 MQPEGAEKGKSFKQRLVLKSSLAKETLSEFLGTFILIVLGCGCVAQAILSRGRFGGVITI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MQPEGAEKGKSFKQRLVLKSSLAKETLSEFLGTFILIVLGCGCVAQAILSRGRFGGVITI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 NVGFSMAVAMAIYVAGGVSGGHINPAVSLAMCLFGRMKWFKLPFYVGAQFLGAFVGAATV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 NVGFSMAVAMAIYVAGGVSGGHINPAVSLAMCLFGRMKWFKLPFYVGAQFLGAFVGAATV 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 FGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPYLSLANAFADQVVATMILLIIVFAIF :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 FGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPYLSLANAFADQVVATMILLIIVFAIF 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE2 DSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAMNPARDLSPRLFTALAGWGFEVFRAG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 DSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAMNPARDLSPRLFTALAGWGFEVFRAG 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 NNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPEPDSVFKAEQSEDKPEKYELSVIM ::::::::::::::::::::::::::::::::::::::.:::::::::::::::: CCDS10 NNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPEPDSVFKTEQSEDKPEKYELSVIM 250 260 270 280 290 >>CCDS81887.1 AQP9 gene_id:366|Hs108|chr15 (230 aa) initn: 1516 init1: 1516 opt: 1516 Z-score: 2008.6 bits: 379.3 E(32554): 1.5e-105 Smith-Waterman score: 1516; 99.6% identity (100.0% similar) in 230 aa overlap (66-295:1-230) 40 50 60 70 80 90 pF1KE2 LIVLGCGCVAQAILSRGRFGGVITINVGFSMAVAMAIYVAGGVSGGHINPAVSLAMCLFG :::::::::::::::::::::::::::::: CCDS81 MAVAMAIYVAGGVSGGHINPAVSLAMCLFG 10 20 30 100 110 120 130 140 150 pF1KE2 RMKWFKLPFYVGAQFLGAFVGAATVFGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 RMKWFKLPFYVGAQFLGAFVGAATVFGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPY 40 50 60 70 80 90 160 170 180 190 200 210 pF1KE2 LSLANAFADQVVATMILLIIVFAIFDSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 LSLANAFADQVVATMILLIIVFAIFDSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAM 100 110 120 130 140 150 220 230 240 250 260 270 pF1KE2 NPARDLSPRLFTALAGWGFEVFRAGNNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPEPDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS81 NPARDLSPRLFTALAGWGFEVFRAGNNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPEPDS 160 170 180 190 200 210 280 290 pF1KE2 VFKAEQSEDKPEKYELSVIM :::.:::::::::::::::: CCDS81 VFKTEQSEDKPEKYELSVIM 220 230 >>CCDS1065.1 AQP10 gene_id:89872|Hs108|chr1 (301 aa) initn: 952 init1: 952 opt: 953 Z-score: 1262.0 bits: 241.5 E(32554): 5.7e-64 Smith-Waterman score: 953; 50.0% identity (80.1% similar) in 276 aa overlap (16-290:14-289) 10 20 30 40 50 60 pF1KE2 MQPEGAEKGKSFKQRLVLKSSLAKETLSEFLGTFILIVLGCGCVAQAILSRGRFGGVITI : ..: ::.. :.::::.:.:..: : ::::. : :. .:. CCDS10 MVFTQAPAEIMGHLRIRSLLARQCLAEFLGVFVLMLLTQGAVAQAVTSGETKGNFFTM 10 20 30 40 50 70 80 90 100 110 120 pF1KE2 NVGFSMAVAMAIYVAGGVSGGHINPAVSLAMCLFGRMKWFKLPFYVGAQFLGAFVGAATV .. :.::..::::.:.:::.:.::: :::::. ::. : :::.:. .:.:.:: ..... CCDS10 FLAGSLAVTIAIYVGGNVSGAHLNPAFSLAMCIVGRLPWVKLPIYILVQLLSAFCASGAT 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE2 FGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPYLSLANAFADQVVATMILLIIVFAIF . .:.:.:....::.: ..: . :: :::::::::::: :.: :::..: .:.. ..::. CCDS10 YVLYHDALQNYTGGNLTVTGPKETASIFATYPAPYLSLNNGFLDQVLGTGMLIVGLLAIL 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE2 DSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAMNPARDLSPRLFTALAGWGFEVFRAG : :: :.: ::::...:.::.... :.: : : .::::::.::::: .:::: ::: :: CCDS10 DRRNKGVPAGLEPVVVGMLILALGLSMGANCGIPLNPARDLGPRLFTYVAGWGPEVFSAG 180 190 200 210 220 230 250 260 270 280 290 pF1KE2 NNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPE-PDSVFKAEQSEDKPEKYELSVIM :..::.:::.:::::..: : :.. .:::: :. . ... : . : CCDS10 NGWWWVPVVAPLVGATVGTATYQLLVALHHPEGPEPAQDLVSAQHKASELETPASAQMLE 240 250 260 270 280 290 CCDS10 CKL 300 >>CCDS6542.1 AQP3 gene_id:360|Hs108|chr9 (292 aa) initn: 943 init1: 918 opt: 952 Z-score: 1260.9 bits: 241.3 E(32554): 6.5e-64 Smith-Waterman score: 952; 51.6% identity (82.2% similar) in 258 aa overlap (16-273:15-272) 10 20 30 40 50 60 pF1KE2 MQPEGAEKGKSFKQRLVLKSSLAKETLSEFLGTFILIVLGCGCVAQAILSRGRFGGVITI : .. : ...:.: :::.::...::: :::..:::: :: .:: CCDS65 MGRQKELVSRCGEMLHIRYRLLRQALAECLGTLILVMFGCGSVAQVVLSRGTHGGFLTI 10 20 30 40 50 70 80 90 100 110 120 pF1KE2 NVGFSMAVAMAIYVAGGVSGGHINPAVSLAMCLFGRMKWFKLPFYVGAQFLGAFVGAATV :..:..::...: .:: :::.:.::::..:::...: :.:::.:. :: ::::.::. : CCDS65 NLAFGFAVTLGILIAGQVSGAHLNPAVTFAMCFLAREPWIKLPIYTLAQTLGAFLGAGIV 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE2 FGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPYLSLANAFADQVVATMILLIIVFAIF ::.:::.. :: ..:.. : :.:: ::::::. .:.. :.: :: ..: :.. :.:: CCDS65 FGLYYDAIWHFADNQLFVSGPNGTAGIFATYPSGHLDMINGFFDQFIGTASLIVCVLAIV 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE2 DSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAMNPARDLSPRLFTALAGWGFEVFRAG : : .::::: ...::...::..:.:.::: :.:::::..::::::::::: :: .: CCDS65 DPYNNPVPRGLEAFTVGLVVLVIGTSMGFNSGYAVNPARDFGPRLFTALAGWGSAVFTTG 180 190 200 210 220 230 250 260 270 280 290 pF1KE2 NNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPEPDSVFKAEQSEDKPEKYELSVIM ...::.:.:.::.:.. : ..: :.: : .: CCDS65 QHWWWVPIVSPLLGSIAGVFVYQLMIGCHLEQPPPSNEEENVKLAHVKHKEQI 240 250 260 270 280 290 >>CCDS6541.1 AQP7 gene_id:364|Hs108|chr9 (342 aa) initn: 753 init1: 708 opt: 830 Z-score: 1098.4 bits: 211.4 E(32554): 7.3e-55 Smith-Waterman score: 830; 42.9% identity (77.7% similar) in 273 aa overlap (13-284:24-295) 10 20 30 40 pF1KE2 MQPEGAEKGKSFKQRLVLKSSLAKETLSEFLGTFILIVLGCGCVAQAIL : . .:. ....: :.::..:....:.: : ::. .: CCDS65 MVQASGHRRSTRGSKMVSWSVIAKIQEILQRKMVREFLAEFMSTYVMMVFGLGSVAHMVL 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE2 SRGRFGGVITINVGFSMAVAMAIYVAGGVSGGHINPAVSLAMCLFGRMKWFKLPFYVGAQ .. ..:. . .:.::...:.:...::: .::.:.: ::..: : .::. : :.: :: .: CCDS65 NK-KYGSYLGVNLGFGFGVTMGVHVAGRISGAHMNAAVTFANCALGRVPWRKFPVYVLGQ 70 80 90 100 110 110 120 130 140 150 160 pF1KE2 FLGAFVGAATVFGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPYLSLANAFADQVVAT :::.:..:::.....: ... :.::.:...: ::: ::::: ...: .: ... : CCDS65 FLGSFLAAATIYSLFYTAILHFSGGQLMVTGPVATAGIFATYLPDHMTLWRGFLNEAWLT 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE2 MILLIIVFAIFDSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAMNPARDLSPRLFTAL .: . .::: :..: : : : ..::.:...:. :::.:.: :.::.::: ::.:: . CCDS65 GMLQLCLFAITDQENNPALPGTEALVIGILVVIIGVSLGMNTGYAINPSRDLPPRIFTFI 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE2 AGWGFEVFRAGNNFWWIPVVGPLVGAVIGGLIYVLVIEIHHP-EPDSVFKAEQSEDKPEK :::: .:: :.:.::.:::.::.:: .::.::.. : : :: .. . :: CCDS65 AGWGKQVFSNGENWWWVPVVAPLLGAYLGGIIYLVFIGSTIPREPLKLEDSVAYEDHGIT 240 250 260 270 280 290 290 pF1KE2 YELSVIM CCDS65 VLPKMGSHEPTISPLTPVSVSPANRSSVHPAPPLHESMALEHF 300 310 320 330 340 >>CCDS83354.1 AQP7 gene_id:364|Hs108|chr9 (256 aa) initn: 606 init1: 606 opt: 702 Z-score: 931.1 bits: 180.1 E(32554): 1.5e-45 Smith-Waterman score: 702; 41.5% identity (77.2% similar) in 241 aa overlap (13-253:23-256) 10 20 30 40 50 pF1KE2 MQPEGAEKGKSFKQRLVLKSSLAKETLSEFLGTFILIVLGCGCVAQAILS : . .:. ....: :.::..:....:.: : ::. .:. CCDS83 MGSGHCLRSTRGSKMVSWSVIAKIQEILQRKMVREFLAEFMSTYVMMVFGLGSVAHMVLN 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE2 RGRFGGVITINVGFSMAVAMAIYVAGGVSGGHINPAVSLAMCLFGRMKWFKLPFYVGAQF . ..:. . .:.::...:.:...::: .::.:.: ::..: : .::. : :.: :: .:: CCDS83 K-KYGSYLGVNLGFGFGVTMGVHVAGRISGAHMNAAVTFANCALGRVPWRKFPVYVLGQF 70 80 90 100 110 120 130 140 150 160 170 pF1KE2 LGAFVGAATVFGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPYLSLANAFADQVVATM ::.:..:::.....: ... :.::.:...: ::: ::::: ...: .: ... : CCDS83 LGSFLAAATIYSLFYTAILHFSGGQLMVTGPVATAGIFATYLPDHMTLWRGFLNEAWLTG 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE2 ILLIIVFAIFDSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAMNPARDLSPRLFTALA .: . .::: :..: : : : ..::.:...:. :::.:.: :.::.::: ::.:: .: CCDS83 MLQLCLFAITDQENNPALPGTEALVIGILVVIIGVSLGMNTGYAINPSRDLPPRIFTFIA 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE2 GWGFEVFRAGNNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPEPDSVFKAEQSEDKPEKYE ::: .::: . : ::.. CCDS83 GWGKQVFR------YCPCPGPFL 240 250 >>CCDS83356.1 AQP7 gene_id:364|Hs108|chr9 (257 aa) initn: 606 init1: 606 opt: 702 Z-score: 931.1 bits: 180.1 E(32554): 1.5e-45 Smith-Waterman score: 702; 41.5% identity (77.2% similar) in 241 aa overlap (13-253:24-257) 10 20 30 40 pF1KE2 MQPEGAEKGKSFKQRLVLKSSLAKETLSEFLGTFILIVLGCGCVAQAIL : . .:. ....: :.::..:....:.: : ::. .: CCDS83 MVQASGHRRSTRGSKMVSWSVIAKIQEILQRKMVREFLAEFMSTYVMMVFGLGSVAHMVL 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE2 SRGRFGGVITINVGFSMAVAMAIYVAGGVSGGHINPAVSLAMCLFGRMKWFKLPFYVGAQ .. ..:. . .:.::...:.:...::: .::.:.: ::..: : .::. : :.: :: .: CCDS83 NK-KYGSYLGVNLGFGFGVTMGVHVAGRISGAHMNAAVTFANCALGRVPWRKFPVYVLGQ 70 80 90 100 110 110 120 130 140 150 160 pF1KE2 FLGAFVGAATVFGIYYDGLMSFAGGKLLIVGENATAHIFATYPAPYLSLANAFADQVVAT :::.:..:::.....: ... :.::.:...: ::: ::::: ...: .: ... : CCDS83 FLGSFLAAATIYSLFYTAILHFSGGQLMVTGPVATAGIFATYLPDHMTLWRGFLNEAWLT 120 130 140 150 160 170 170 180 190 200 210 220 pF1KE2 MILLIIVFAIFDSRNLGAPRGLEPIAIGLLIIVIASSLGLNSGCAMNPARDLSPRLFTAL .: . .::: :..: : : : ..::.:...:. :::.:.: :.::.::: ::.:: . CCDS83 GMLQLCLFAITDQENNPALPGTEALVIGILVVIIGVSLGMNTGYAINPSRDLPPRIFTFI 180 190 200 210 220 230 230 240 250 260 270 280 pF1KE2 AGWGFEVFRAGNNFWWIPVVGPLVGAVIGGLIYVLVIEIHHPEPDSVFKAEQSEDKPEKY :::: .::: . : ::.. CCDS83 AGWGKQVFR------YCPCPGPFL 240 250 >>CCDS83353.1 AQP7 gene_id:364|Hs108|chr9 (216 aa) initn: 624 init1: 606 opt: 620 Z-score: 823.8 bits: 160.0 E(32554): 1.5e-39 Smith-Waterman score: 620; 41.9% identity (76.7% similar) in 215 aa overlap (48-258:2-215) 20 30 40 50 60 70 pF1KE2 LKSSLAKETLSEFLGTFILIVLGCGCVAQAILSRGRFGGVITINVGFSMAVAMAIYVAGG .:.. ..:. . .:.::...:.:...::: CCDS83 MVLNK-KYGSYLGVNLGFGFGVTMGVHVAGR 10 20 30 80 90 100 110 120 130 pF1KE2 VSGGHINPAVSLAMCLFGRMKWFKLPFYVGAQFLGAFVGAATVFGIYYDGLMSFAGGKLL .::.:.: ::..: : .::. : :.: :: .::::.:..:::.....: ... :.::.:. CCDS83 ISGAHMNAAVTFANCALGRVPWRKFPVYVLGQFLGSFLAAATIYSLFYTAILHFSGGQLM 40 50 60 70 80 90 140 150 160 170 180 190 pF1KE2 IVGENATAHIFATYPAPYLSLANAFADQVVATMILLIIVFAIFDSRNLGAPRGLEPIAIG ..: ::: ::::: ...: .: ... : .: . .::: :..: : : : ..:: CCDS83 VTGPVATAGIFATYLPDHMTLWRGFLNEAWLTGMLQLCLFAITDQENNPALPGTEALVIG 100 110 120 130 140 150 200 210 220 230 240 250 pF1KE2 LLIIVIASSLGLNSGCAMNPARDLSPRLFTALAGWGFEVFRAGN--NFWWI--PVVGPLV .:...:. :::.:.: :.::.::: ::.:: .:::: .::: . .. :. :. .: . CCDS83 ILVVIIGVSLGMNTGYAINPSRDLPPRIFTFIAGWGKQVFRWHHLPGLHWLHHPTGAPEI 160 170 180 190 200 210 260 270 280 290 pF1KE2 GAVIGGLIYVLVIEIHHPEPDSVFKAEQSEDKPEKYELSVIM :. : CCDS83 GGFCGV 295 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 17:04:13 2016 done: Tue Nov 8 17:04:13 2016 Total Scan time: 2.070 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]